Risoluzione problemi comuni server Aruba

Navigation:  Reparto Hardware e Sistemi > Procedure Interne >

Risoluzione problemi comuni server Aruba

Previous pageReturn to chapter overviewNext page

saas-a10 (localhost)

 

current load: controllare numero di processi in esecuzione

current user: controllare con attenzione numero di utenti connessi, verificare lastlog

http: controllare con attenzione i log di apache  

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

root partition: vedere cosa è possibile cancellare

ssh: controllare stato del demone e connessioni

swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

total processes: controllare processi esistenti

 

saas-a1 (motore)

 

all services: controllare cosa è in esecuzione su windows al momento

cpu load: controllare presenza processi thin client appesi dall'utente servermotore e dall'utente fatainvio

disk c: collegarsi e pulire disco con tool di windows e a mano (vedere file inutili lasciati in giro)

memory load: controllare presenza thin appesi dall'utente servermotore e dall'utente fatainvio

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

 

saas-a2 (postgres)

 

all services: controllare cosa è in esecuzione su windows al momento

cpu load: controllare stato in corso della replica di postgres

check_db: controllare che il servizio postgres sia in esecuzione e che sia possibile collegarsi ad esso via telnet; cosi non fosse avvisare programmatori

check_kpn_master_db: verificare connessione in telnet a kpngate.es2000.it sulla porta 8888; cosi non fosse avvisare programmatori

disk c: pulire disco con tool di windows e a mano (vedere file inutili lasciati in giro, in particolare vecchi backup del database)

memory load: controllare stato in corso della replica di postgres, che può determinare una occupazione anche totale

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

 

saas-a3 (fata)

 

acuconnect-5632: controllare con service rclservice_suse status che acushare sia in ascolto alla 5632. se non lo è, riavviarlo andando in "/opt/es2000/" e dare il comando "./cmdacu_server start 5632". Se però la porta è in hang (rclservice_suse si pianta nella fase di listing), bisogna identificare quale pid sta occupando la porta tramite output dei comandi "ps" e "netstat -taun" e terminarlo e tentare il restart con lo stesso comando scritto prima. quasi sempre questo comporta in realtà di dover riavviare l'intera macchina virtuale poiché il processo non viene terminato.

all disks: vedere cosa si può cancellare, prestare attenzione ai vari file di log sparsi in "/opt/es2000/xxx/log" e sottocartelle, "/es2000/ecoge/d/cxxxxx/arc/log" ecc ecc. Controllare anche presenza di copie di ambienti create per test e rimaste lì.

current load: verificare runcblpq al 100% e terminarli andando in /opt/es2000/ e dando il comando "./cmdacu_client stop xxxx" oppure "./cmdacu_client kill xxxx", in cui xxxx è il pid determinato dal comando top o dal "service rclservice_suse status"

current user: controllare con attenzione numero di utenti connessi, verificare lastlog

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

ssh: controllare stato del demone e connessioni

swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

total processes: controllare processi esistenti

zombie processes: controllare processi esistenti, in caso di emergenza identificare con pstree il pid del processo padre del processo zombie e  tentare il reaping col comando "kill -s SIGCHLD xxx" dove xxx è il pid.

 

saas-a4 (iscobol jose)

 

acuconnect-5632: controllare con service rclservice_suse status che acushare sia in ascolto alla 5632. se non lo è, riavviarlo andando in "/opt/es2000/" e dare il comando "./cmdacu_server start 5632". Se però la porta è in hang (rclservice_suse si pianta nella fase di listing), bisogna identificare quale pid sta occupando la porta tramite output dei comandi "ps" e "netstat -taun" e terminarlo e tentare il restart con lo stesso comando scritto prima. quasi sempre questo comporta in realtà di dover riavviare l'intera macchina virtuale poiché il processo non viene terminato.

all disks: vedere cosa si può cancellare, prestare attenzione ai vari file di log sparsi in "/opt/es2000/xxx/log" e sottocartelle, "/es2000/ecoge/d/cxxxxx/arc/log" ecc ecc. Controllare anche presenza di copie di ambienti create per test e rimaste lì.

current load: verificare runcblpq al 100% e terminarli andando in /opt/es2000/ e dando il comando "./cmdacu_client stop xxxx" oppure "./cmdacu_client kill xxxx", in cui xxxx è il pid determinato dal comando top o dal "service rclservice_suse status"

current user: controllare con attenzione numero di utenti connessi, verificare lastlog

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

ssh: controllare stato del demone e connessioni

swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

total processes: controllare processi esistenti

zombie processes: controllare processi esistenti, in caso di emergenza identificare con pstree il pid del processo padre del processo zombie e  tentare il reaping col comando "kill -s SIGCHLD xxx" dove xxx è il pid.

 

saas-a5 (saas)

 

acuconnect-5632: controllare con service rclservice_suse status che acushare sia in ascolto alla 5632. se non lo è, riavviarlo andando in "/opt/es2000/" e dare il comando "./cmdacu_server start 5632". Se però la porta è in hang (rclservice_suse si pianta nella fase di listing), bisogna identificare quale pid sta occupando la porta tramite output dei comandi "ps" e "netstat -taun" e terminarlo e tentare il restart con lo stesso comando scritto prima. quasi sempre questo comporta in realtà di dover riavviare l'intera macchina virtuale poiché il processo non viene terminato.

acuconnect-5633: controllare con service rclservice_suse status che acushare sia in ascolto alla 5633. se non lo è, riavviarlo andando in "/opt/es2000/" e dare il comando "./cmdacu_server start 5633". Se però la porta è in hang (rclservice_suse si pianta nella fase di listing), bisogna identificare quale pid sta occupando la porta tramite output dei comandi "ps" e "netstat -taun" e terminarlo e tentare il restart con lo stesso comando scritto prima. quasi sempre questo comporta in realtà di dover riavviare l'intera macchina virtuale poiché il processo non viene terminato

all disks: vedere cosa si può cancellare, prestare attenzione ai vari file di log sparsi in "/opt/es2000/xxx/log" e sottocartelle, "/es2000/ecoge/d/cxxxxx/arc/log" ecc ecc. Controllare anche presenza di copie di ambienti create per test e rimaste lì.

current load: verificare runcblpq al 100% e terminarli andando in /opt/es2000/ e dando il comando "./cmdacu_client stop xxxx" oppure "./cmdacu_client kill xxxx", in cui xxxx è il pid determinato dal comando top o dal "service rclservice_suse status"

current user: controllare con attenzione numero di utenti connessi, verificare lastlog

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

ssh: controllare stato del demone e connessioni

swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

total processes: controllare processi esistenti

zombie processes: controllare processi esistenti, in caso di emergenza identificare con pstree il pid del processo padre del processo zombie e  tentare il reaping col comando "kill -s SIGCHLD xxx" dove xxx è il pid.

 

saas-a6 (jasper)

 

all services: controllare stato dei servizi iis, tomcat e associati a jasper.

cpu load: controllare stato dei servizi iis, tomcat e associati a jasper.

disk c: collegarsi e pulire disco con tool di windows e a mano (vedere file inutili lasciati in giro)

memory load: controllare stato in corso della replica di postgres, che può determinare una occupazione anche totale

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

 

saas-a7 (ftp2)

 

all disks: vedere cosa si può cancellare, attivarsi per effettuare espansione del disco della macchina virtuale e dell'lvm

current load: verificare stato di proftpd e carico attuale

current user: controllare con attenzione numero di utenti connessi, verificare lastlog

ftp: controllare stato proftpd e farlo ripartire/ricaricare secondo necessario

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

ssh: controllare stato del demone e connessioni

swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

total processes: controllare processi esistenti

zombie processes: controllare processi esistenti, in caso di emergenza identificare con pstree il pid del processo padre del processo zombie e  tentare il reaping col comando "kill -s SIGCHLD xxx" dove xxx è il pid.

 

saas-a8 (apollonia)

 

acuconnect-5632: controllare con service rclservice_suse status che acushare sia in ascolto alla 5632. se non lo è, riavviarlo andando in "/opt/es2000/" e dare il comando "./cmdacu_server start 5632". Se però la porta è in hang (rclservice_suse si pianta nella fase di listing), bisogna identificare quale pid sta occupando la porta tramite output dei comandi "ps" e "netstat -taun" e terminarlo e tentare il restart con lo stesso comando scritto prima. quasi sempre questo comporta in realtà di dover riavviare l'intera macchina virtuale poiché il processo non viene terminato.

all disks: vedere cosa si può cancellare, prestare attenzione ai vari file di log sparsi in "/opt/es2000/xxx/log" e sottocartelle, "/es2000/ecoge/d/cxxxxx/arc/log" ecc ecc. Controllare anche presenza di copie di ambienti create per test e rimaste lì.

current load: verificare runcblpq al 100% e terminarli andando in /opt/es2000/ e dando il comando "./cmdacu_client stop xxxx" oppure "./cmdacu_client kill xxxx", in cui xxxx è il pid determinato dal comando top o dal "service rclservice_suse status"

current user: controllare con attenzione numero di utenti connessi, verificare lastlog

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

ssh: controllare stato del demone e connessioni

swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

total processes: controllare processi esistenti

zombie processes: controllare processi esistenti, in caso di emergenza identificare con pstree il pid del processo padre del processo zombie e  tentare il reaping col comando "kill -s SIGCHLD xxx" dove xxx è il pid.

 

saas-a9 (lamp)

 

all disks: vedere cosa si può cancellare

current load: verificare stato di mysql che potremme mandare la macchina in saturazione

current user: controllare con attenzione numero di utenti connessi, verificare lastlog

db areagate: controllare lo stato del database mysql, se le slow query sono molte o ci sono molte tabelle aperte sentire i programmatori.

http: controllare stato di apache

ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

ssh: controllare stato del demone e connessioni

swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

total processes: controllare processi esistenti

zombie processes: controllare processi esistenti, in caso di emergenza identificare con pstree il pid del processo padre del processo zombie e  tentare il reaping col comando "kill -s SIGCHLD xxx" dove xxx è il pid.