Leistungsoptimierung für Node.js auf VPS

Leistungsoptimierung von Node.js für Produktions-VPS-Hosting – Titelbild

Leistungsprobleme mit Node.js im Produktivbetrieb lassen sich fast immer auf dieselben wenigen Ursachen zurückführen: eine Ein-Prozess-Anwendung, die an einen CPU-Kern gebunden ist, fehlende Caching-Ebenen, eine durch synchrone Aufgaben blockierte Ereignisschleife und ein Prozessmanager, der um 2 Uhr morgens still und leise abstürzt.

In diesem Artikel geht es um die Optimierungsmaßnahmen, die die Latenz des p95 und die Kapazität für gleichzeitige Anfragen auf einem Produktions-VPS tatsächlich verbessern, sowie um die Konfigurationsmuster, die sich im realen Datenverkehr bewähren.

Inhaltsverzeichnis

Warum die Leistungsoptimierung von Node.js auf einem Produktions-VPS wichtig ist

Ein VPS bietet dir Root-Zugriff, eine dedizierte vCPU-Zuweisung und eine dauerhafte Prozesssteuerung, was Shared Hosting nicht leisten kann – und genau das braucht ein lang laufender Node.js-Prozess. Die Standardkonfiguration von Node. js („server.js“) führt deine Anwendung als Einzelprozess auf einem einzigen Thread aus. Daher nutzt ein VPS mit 4 vCPUs, auf dem eine nicht optimierte App läuft, nur etwa 25 % der Hardware, für die du bezahlst. Durch Optimierung lässt sich diese Lücke schließen.

Ein weiterer Grund für die Optimierung auf der VPS-Ebene ist, dass Node.js für den Anwendungscode von Haus aus single-threaded ist. Die Laufzeitumgebung nutzt eine Event-Loop und einen libuv-Thread-Pool für die E/A-Verarbeitung, aber jede von dir geschriebene CPU-intensive Aufgabe blockiert weiterhin jede Anfrage auf diesem Worker. Bei der Optimierung für den Produktivbetrieb geht es vor allem darum, CPU-intensive Aufgaben aus der Event-Loop herauszuholen. Dazu gehört auch, kostengünstigere Schichten vor Node zu schalten, damit die Laufzeitumgebung nur das verarbeitet, was sie unbedingt muss.

Was sind die häufigsten Leistungsengpässe bei Node.js?

Die tatsächlichen Produktionsprobleme lassen sich auf eine Handvoll Hauptursachen zurückführen:

Ein-Prozess-Bereitstellungen. Ein „One Node“-Prozess kann nicht mehr als einen CPU-Kern für den Anwendungscode nutzen, sodass ein Multi-Core-VPS unter Last ungenutzt bleibt.
Blockierte Ereignisschleife. Synchrones Einlesen von Dateien, „JSON.parse“ bei großen Datenmengen, „bcrypt“-Hash-Berechnungen im Hauptthread oder unbegrenzte Verzögerungen durch reguläre Ausdrücke blockieren jede gleichzeitige Anfrage.
Speicherlecks durch verbleibende Verweise. Langlebige Closures, wachsende In-Memory-Caches ohne Verdrängung und angehängte Ereignis-Listener ohne Bereinigung treiben die Heap-Auslastung unbemerkt über die standardmäßige Obergrenze von 1,5 GB hinaus.
Kein Caching auf HTTP-Ebene. Jede Anfrage wird vom Anwendungscode bearbeitet, selbst bei Antworten, die sich stündlich ändern.
Direkter Zugang zum Internet. Wenn du einen Knoten auf Port 80 oder 443 ohne Nginx Frontend betreibst , müssen deine Anwendung die TLS-Terminierung, die Bereitstellung statischer Dateien und die Pufferung für langsame Clients übernehmen.
Datenbank-Roundtrips auf dem Hot Path. Fehlende Indizes und N+1-Abfragen werden als Leistungsprobleme des Knotens angezeigt, obwohl die eigentliche Zeit mit dem Warten auf die Datenbank verbracht wird.

Um herauszufinden, welches Problem bei dir vorliegt, musst du Messungen durchführen – nicht raten. Überprüfe zunächst die Verzögerung der Ereignisschleife und die Heap-Auslastung, bevor du irgendetwas änderst.

Wie legt man die richtige Anzahl an Node.js-Clustern und -Workern fest?

Das Cluster-Muster lässt pro CPU-Kern einen Node-Prozess laufen, wobei ein Master-Prozess die Verbindungen an die Worker verteilt. Das Node.js-Cluster-Modul ist in die Laufzeitumgebung integriert und bildet die Grundlage, auf der PM2 und die meisten Prozessmanager im Hintergrund basieren.

Die allgemeine Regel:

CPU-gebundene oder ausgewogene Workloads: Anzahl der Worker = Anzahl der vCPUs. Auf einem VPS mit 4 vCPUs solltest du 4 Worker ausführen.
I/O-intensive Workloads: Die Gleichung „Worker = vCPUs“ ist nach wie vor der richtige Ausgangspunkt. Mehr hinzuzufügen hilft selten, da der Engpass bei der Datenbank oder der externen API liegt, nicht bei Node.
VPS-Tarife mit begrenztem Speicher: Anzahl der Worker = floor(verfügbarer RAM / Heap pro Worker). Wenn jeder Worker 400 MB Heap belegt und dir nach dem Betriebssystem 2 GB frei bleiben, sind vier Worker die Obergrenze, unabhängig von der Anzahl der Kerne.

Mit PM2 legst du das deklarativ fest:

pm2 start app.js -i max --name api

pm2 start app.js -i max --name api

Die -i max Der Flag generiert einen Worker pro verfügbarem Kern. Gib eine bestimmte Anzahl an, zum Beispiel -i 4, wenn du auf demselben VPS Platz für einen Datenbank- oder Cache-Prozess lassen möchtest.

Welche PM2- und Process-Manager-Einstellungen verbessern die Stabilität?

PM2 ist der gängigste Produktionsprozessmanager für Node, und die Standardeinstellungen entsprechen nicht der Konfiguration, die du bei großem Umfang benötigst. Ein produktionsreifes ecosystem.config.js sieht eher so aus:

module.exports = {
  apps: [{
    name: 'api',
    script: './server.js',
    instances: 'max',
    exec_mode: 'cluster',
    max_memory_restart: '500M',
    node_args: '--max-old-space-size=460',
    env_production: {
      NODE_ENV: 'production',
      PORT: 3000
    },
    error_file: '/var/log/pm2/api-err.log',
    out_file: '/var/log/pm2/api-out.log',
    merge_logs: true,
    time: true
  }]
};

module.exports = {
  apps: [{
    name: 'api',
    script: './server.js',
    instances: 'max',
    exec_mode: 'cluster',
    max_memory_restart: '500M',
    node_args: '--max-old-space-size=460',
    env_production: {
      NODE_ENV: 'production',
      PORT: 3000
    },
    error_file: '/var/log/pm2/api-err.log',
    out_file: '/var/log/pm2/api-out.log',
    merge_logs: true,
    time: true
  }]
};

Ein paar Details, die in der Produktion wichtig sind:

max_memory_restart löst einen sanften Neustart aus, bevor ein Worker das V8-Heap-Limit erreicht und vom OOM-Killer des Betriebssystems beendet wird. Stell den Wert auf 5 bis 10 % darunter ein --max-old-space-size.
exec_mode: cluster Das ist es, was den Lastausgleich zwischen den Workern tatsächlich ermöglicht. Im Fork-Modus werden unabhängige Prozesse ohne gemeinsame Portbindung ausgeführt.
Protokollrotation ist standardmäßig nicht aktiviert. Installiere pm2-logrotate und stelle ein pm2 set pm2-logrotate:max_size 50M und pm2 set pm2-logrotate:retain 14 damit die Protokolldateien bei einem Traffic-Anstieg nicht die Festplatte füllen.
Start-Persistenz. Los pm2 startup systemd und pm2 save damit die Worker nach einem Neustart oder einer Kernel-Aktualisierung automatisch wieder online gehen.

Für ein Neuladen ohne Ausfallzeiten bei der Bereitstellung verwende pm2 reload api statt restart. „Reload Swaps“ wechselt die Worker nacheinander aus, während der Cluster online bleibt.

Wie konfiguriert man Nginx Reverse-Proxy für Node.js?

Nginx Node Nginx schalten, ist für die meisten Produktionsumgebungen die Änderung mit der größten Wirkung. Nginx die TLS-Terminierung, die Bereitstellung statischer Assets, die gzip- und Brotli-Komprimierung, die Pufferung von Anfragen für langsame Clients sowie das HTTP/2-Multiplexing, sodass Node sich ganz auf die Aufgaben konzentrieren kann, die dein Anwendungscode erfordert.

Ein minimaler Produktionsserver-Block:

uupstream node_api {
    server 127.0.0.1:3000;
    keepalive 64;
}
 
server {
    listen 443 ssl http2;
    server_name api.example.com;
 
    ssl_certificate     /etc/letsencrypt/live/api.example.com/fullchain.pem;
    ssl_certificate_key /etc/letsencrypt/live/api.example.com/privkey.pem;
 
    gzip on;
    gzip_types application/json text/css application/javascript;
 
    location /static/ {
        alias /var/www/api/public/;
        expires 30d;
        add_header Cache-Control "public, immutable";
    }
 
    location / {
        proxy_pass http://node_api;
        proxy_http_version 1.1;
        proxy_set_header Connection "";
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;
        proxy_read_timeout 60s;
    }
}

uupstream node_api {
    server 127.0.0.1:3000;
    keepalive 64;
}
 
server {
    listen 443 ssl http2;
    server_name api.example.com;
 
    ssl_certificate     /etc/letsencrypt/live/api.example.com/fullchain.pem;
    ssl_certificate_key /etc/letsencrypt/live/api.example.com/privkey.pem;
 
    gzip on;
    gzip_types application/json text/css application/javascript;
 
    location /static/ {
        alias /var/www/api/public/;
        expires 30d;
        add_header Cache-Control "public, immutable";
    }
 
    location / {
        proxy_pass http://node_api;
        proxy_http_version 1.1;
        proxy_set_header Connection "";
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;
        proxy_read_timeout 60s;
    }
}

Zwei Details, die Entwickler am häufigsten übersehen: die Einstellung proxy_http_version 1.1 plus die leere Connection Der Header ermöglicht die Wiederverwendung der Verbindung vom Upstream-Keepalive-Pool, was den Overhead beim TCP-Handshake unter Last drastisch reduziert. Bereitstellung /static/ direkt aus Nginx langen Cache-Control Header entlasten deine Node-Worker zudem um Tausende von Anfragen pro Minute für Dateien, auf die sie niemals hätten zugreifen dürfen.

Welche Flags für Speicher und Garbage Collection solltest du anpassen?

Node nutzt intern V8, und die standardmäßige Heap-Größe der alten Generation von V8 beträgt auf 64-Bit-Systemen etwa 1,5 GB, unabhängig davon, wie viel RAM der VPS tatsächlich hat. Auf einem 4-GB-VPS, auf dem vier Worker laufen, bleiben bei dieser Standardeinstellung etwa 10 GB theoretische Heap-Kapazität ungenutzt, da sich jeder Worker selbst begrenzt.

Das zu setzende Flag lautet --max-old-space-size, angegeben in Megabyte:

node --max-old-space-size=460 server.js

node --max-old-space-size=460 server.js

Größenratgeber:

Reserviere etwa 25 % des gesamten Arbeitsspeichers für das Betriebssystem, Nginx und alle Datenbanken oder Caches, die auf demselben VPS laufen.
Teile den Rest durch die Anzahl deiner Worker und ziehe dann 10 % für den V8-Overhead ab. Bei einem 2-GB-VPS mit 4 Workern ergibt das etwa 460 MB pro Worker.
Spiel max_memory_restart in PM2 auf diesen Wert oder etwas darunter. Ein Prozess, der von PM2 neu gestartet wurde, kann wiederhergestellt werden; einer, der vom OOM-Killer des Kernels beendet wurde, nicht.

Bei Diensten mit sehr hohem Durchsatz lohnen sich außerdem folgende Optionen zum Ausprobieren: --max-semi-space-size um der jungen Generation mehr Spielraum zu geben (indem die Häufigkeit kleinerer GCs bei Diensten, die aggressiv Speicher zuweisen, reduziert wird) und --no-compilation-cache Falls du bei kurzlebigen Workern Speicherengpässe durch zwischengespeicherten kompilierten Code feststellst, teste Änderungen unter Last, bevor du sie in die Produktion überführst.

Wie analysiert man eine langsame Node.js-Anwendung?

Die meisten Maßnahmen zur Leistungsoptimierung scheitern, weil der Entwickler das Falsche optimiert hat. Erst profilieren, dann den Code ändern:

node --inspect server.js Mit den Chrome DevTools erhältst du ein Flammendiagramm zur CPU-Auslastung und ein Tool für Heap-Snapshots, um zurückbehaltene Objekte zu finden. Der Reiter „Leistung“ in den DevTools ist der schnellste Weg, um eine blockierte Ereignisschleife zu identifizieren.
clinic doctor (clinicjs.org) führt deine App unter Last aus und erstellt eine Diagnose. Es eignet sich besonders gut dazu, Verzögerungen in der Ereignisschleife und übermäßigen GC-Druck zu erkennen, bevor du dich näher damit befasst.
autocannon ist der Lastgenerator, auf den die meisten Node-Entwickler zurückgreifen. Ein Basis-Benchmark vor jeglicher Optimierung liefert dir den Vergleichswert, den du brauchst, um zu wissen, ob deine Änderungen geholfen oder geschadet haben.
Überwachung von Event-Loop-Verzögerungen in der Produktion gehört in dein APM oder ein einfaches perf_hooks.monitorEventLoopDelay() Exporter zu Prometheus. Eine Verzögerung von über 50 ms bei konstanter Auslastung ist ein Anzeichen dafür, dass etwas Synchrones die Worker blockiert.

Wenn ein einzelner Endpunkt langsam ist, miss die Dauer der Datenbankabfrage getrennt vom Handler. Der Node-Profiler wird auf await pool.query(...) als die langsame Stelle, aber die Arbeit findet in PostgreSQL MySQL statt, nicht in deinem Code.

Welche Caching-Ebenen machen den größten Unterschied?

Caching ist die Optimierung mit dem höchsten ROI, die die meisten Teams übersehen. Bei Produktions-Workloads mit Node.js spielen drei Ebenen eine Rolle:

Caching auf Anwendungsebene mit Redis. Verlege die Speicherung von Sitzungsdaten, Zähler für die Ratenbegrenzung und häufig abgerufene Abfrageergebnisse aus der Datenbank in Redis auf demselben VPS oder einem Nachbarn im privaten Netzwerk. Ein Hin- und Rücklauf zum lokalen Redis dauert weniger als eine Millisekunde; dieselbe Abfrage bei PostgreSQL kaltem Cache kann 20 bis 80 ms dauern.
HTTP-Antwort-Caching bei Nginx. Für Endpunkte, die für dieselbe URL identische Antworten zurückgeben, proxy_cache Nginx Tausende von Anfragen pro Sekunde direkt von der Festplatte aus bedienen, ohne Node überhaupt zu belasten. Schon ein 10-Sekunden-Cache-Fenster für einen häufig aufgerufenen Endpunkt reduziert die Auslastung des Upstreams drastisch.
Ein CDN vor deinem VPS. Cloudflare, Bunny oder ein beliebiges Reverse-Proxy-CDN übernimmt den Datenverkehr für statische Inhalte, beendet die TLS-Verbindung am Rand und schützt den Ursprungsserver vor Bot-Traffic. Für Nutzer weltweit ist die Verbesserung der Latenz in der Regel größer als bei jeder Optimierung auf Anwendungsebene.

Die Reihenfolge, in der du sie hinzufügen solltest, ist die angegebene Reihenfolge. Redis kommt an erster Stelle, da es die Struktur deiner Anwendung verändert. Nginx an zweiter Stelle, da es keine Codeänderungen erfordert, und ein CDN an dritter Stelle, da es selbst einer nicht optimierten App zugute kommt.

Wie sichert man einen Node.js-VPS für die Produktion?

Leistung und Sicherheit überschneiden sich stärker, als Entwickler vermuten, denn eine ungeschützte Anwendung ist nur einen Botnet-Scan davon entfernt, nicht mehr verfügbar zu sein. Grundlegende Absicherung für einen Node.js-VPS:

Führe Node als Nicht-Root-Benutzer aus. Verwendung setcap 'cap_net_bind_service=+ep' $(which node) Wenn du ohne Root-Rechte an Ports unterhalb von 1024 binden musst oder den Datenverkehr bei Nginx beenden Nginx Node auf Port 3000 lauschen lassen willst.
Konfiguriere eine Host-Firewall. UFW unter Ubuntu oder firewalld Unter AlmaLinux wird der Server so eingeschränkt, dass nur die Ports zugänglich sind, die du bewusst freigibst, in der Regel 22, 80 und 443.
Halte die Abhängigkeiten auf dem neuesten Stand. npm audit in CI und Dependabot oder Renovate im Repository, um CVEs in transitiven Abhängigkeiten zu erkennen, bevor sie in die Produktion gelangen.
HTTP-Sicherheitsheader setzen. Helm ist die Standard-Express-Middleware für Header wie Strict-Transport-Security, Content-Security-Policy, und X-Frame-Options. Falsch konfigurierte Header gehören zu den häufigsten Befunden bei Sicherheitsaudits.
Wechsle die Geheimnisse regelmäßig und verwende Umgebungsvariablen. Lege .env-Dateien niemals fest. Tools wie Doppler, Vault oder sogar systemd EnvironmentFile= Diese Richtlinien sorgen dafür, dass Anmeldedaten nicht im Repository gespeichert werden.

Wann solltest du über einen einzelnen VPS hinaus skalieren?

Eine gut optimierte Node.js-Anwendung auf einem VPS mit 4 bis 8 vCPUs, Nginx Redis kann problemlos Millionen von Anfragen pro Tag bewältigen. Eine horizontale Skalierung wird in der Regel aus einem der folgenden drei Gründe notwendig:

Eine anhaltende CPU-Auslastung von über 70 % bei allen Workern, selbst nach Änderungen an der Profilierung und am Caching, deutet darauf hin, dass dir die Kapazitäten nicht mehr ausreichen.
Strenge SLA-Vorgaben zur Verfügbarkeit, die keinen Ausfall eines einzelnen Hosts zulassen, erfordern mindestens zwei Anwendungs-VPS-Instanzen hinter einem Load Balancer.
Die Trennung zustandsbehafteter Ressourcen lohnt sich betrieblich gesehen, sobald deine Datenbank, dein Cache und deine Anwendungs-Workloads auf einem gemeinsam genutzten VPS um dieselben Festplatten-E/A-Ressourcen oder denselben Arbeitsspeicher konkurrieren.

Sowohl die Cloud-VPS- als auch die Managed-VPS-Tarife von InMotion bieten vollen Root-Zugriff, dedizierte vCPU-Zuweisung und Linux-Distributionen wie AlmaLinux 9, Ubuntu 22.04 LTS und Debian 12, die die Laufzeitanforderungen für jede aktuelle Node.js-LTS-Version abdecken. Die SLA mit 99,99 % Verfügbarkeit und der 24/7-Zugang zum APS-Team sind besonders wichtig, sobald deine Anwendung kein Nebenprojekt mehr ist, sondern Umsatz generiert.

Wenn du eine Node.js-Produktionsanwendung auf einem Shared-Hosting-Server oder einem VPS betreibst, der nicht über die Standardeinstellungen hinaus optimiert wurde, werden die in diesem Artikel beschriebenen Änderungen die p95-Latenz wahrscheinlich um die Hälfte reduzieren. Außerdem können sie den nachhaltigen Anforderungsdurchsatz verdoppeln, ohne dass du einen weiteren Cent für die Infrastruktur ausgeben musst. Beginne mit dem PM2-Cluster-Modus und Nginx Frontend, analysiere die verbleibenden Engpässe und füge Caching hinzu, wo es die Datenlage zulässt.

Praktische Tipps zur Leistungsoptimierung von Node.js für Produktions-VPS-Hosting, einschließlich Clustering, PM2, Nginx , Speicheroptionen und Caching-Ebenen.

Bist du bereit, Node.js in der Produktion einzusetzen? Die Managed-VPS-Pakete von InMotion bieten dir Root-Zugriff, dedizierte vCPU-Zuweisung und die Wahl zwischen AlmaLinux 9, Ubuntu 22.04 LTS oder Debian 12. Dazu gibt es einen 24/7-Support durch echte Mitarbeiter und eine SLA mit einer Verfügbarkeit von 99,99 %.

Diesen Artikel teilen