Reparto Hardware e Sistemi > Procedure Interne > Risoluzione problemi comuni server Aruba

saas-a10 (localhost)

•current load: controllare numero di processi in esecuzione

•current user: controllare con attenzione numero di utenti connessi, verificare lastlog

•http: controllare con attenzione i log di apache

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

•root partition: vedere cosa è possibile cancellare

•ssh: controllare stato del demone e connessioni

•swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

•total processes: controllare processi esistenti

saas-a1 (motore)

•all services: controllare cosa è in esecuzione su windows al momento

•cpu load: controllare presenza processi thin client appesi dall'utente servermotore e dall'utente fatainvio

•disk c: collegarsi e pulire disco con tool di windows e a mano (vedere file inutili lasciati in giro)

•memory load: controllare presenza thin appesi dall'utente servermotore e dall'utente fatainvio

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

saas-a2 (postgres)

•all services: controllare cosa è in esecuzione su windows al momento

•cpu load: controllare stato in corso della replica di postgres

•check_db: controllare che il servizio postgres sia in esecuzione e che sia possibile collegarsi ad esso via telnet; cosi non fosse avvisare programmatori

•check_kpn_master_db: verificare connessione in telnet a kpngate.es2000.it sulla porta 8888; cosi non fosse avvisare programmatori

•disk c: pulire disco con tool di windows e a mano (vedere file inutili lasciati in giro, in particolare vecchi backup del database)

•memory load: controllare stato in corso della replica di postgres, che può determinare una occupazione anche totale

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

saas-a3 (fata)

•acuconnect-5632: controllare con service rclservice_suse status che acushare sia in ascolto alla 5632. se non lo è, riavviarlo andando in "/opt/es2000/" e dare il comando "./cmdacu_server start 5632". Se però la porta è in hang (rclservice_suse si pianta nella fase di listing), bisogna identificare quale pid sta occupando la porta tramite output dei comandi "ps" e "netstat -taun" e terminarlo e tentare il restart con lo stesso comando scritto prima. quasi sempre questo comporta in realtà di dover riavviare l'intera macchina virtuale poiché il processo non viene terminato.

•all disks: vedere cosa si può cancellare, prestare attenzione ai vari file di log sparsi in "/opt/es2000/xxx/log" e sottocartelle, "/es2000/ecoge/d/cxxxxx/arc/log" ecc ecc. Controllare anche presenza di copie di ambienti create per test e rimaste lì.

•current load: verificare runcblpq al 100% e terminarli andando in /opt/es2000/ e dando il comando "./cmdacu_client stop xxxx" oppure "./cmdacu_client kill xxxx", in cui xxxx è il pid determinato dal comando top o dal "service rclservice_suse status"

•current user: controllare con attenzione numero di utenti connessi, verificare lastlog

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

•ssh: controllare stato del demone e connessioni

•swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

•total processes: controllare processi esistenti

•zombie processes: controllare processi esistenti, in caso di emergenza identificare con pstree il pid del processo padre del processo zombie e tentare il reaping col comando "kill -s SIGCHLD xxx" dove xxx è il pid.

saas-a4 (iscobol jose)

•current user: controllare con attenzione numero di utenti connessi, verificare lastlog

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

•ssh: controllare stato del demone e connessioni

•swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

•total processes: controllare processi esistenti

saas-a5 (saas)

•acuconnect-5633: controllare con service rclservice_suse status che acushare sia in ascolto alla 5633. se non lo è, riavviarlo andando in "/opt/es2000/" e dare il comando "./cmdacu_server start 5633". Se però la porta è in hang (rclservice_suse si pianta nella fase di listing), bisogna identificare quale pid sta occupando la porta tramite output dei comandi "ps" e "netstat -taun" e terminarlo e tentare il restart con lo stesso comando scritto prima. quasi sempre questo comporta in realtà di dover riavviare l'intera macchina virtuale poiché il processo non viene terminato

•current user: controllare con attenzione numero di utenti connessi, verificare lastlog

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

•ssh: controllare stato del demone e connessioni

•swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

•total processes: controllare processi esistenti

saas-a6 (jasper)

•all services: controllare stato dei servizi iis, tomcat e associati a jasper.

•cpu load: controllare stato dei servizi iis, tomcat e associati a jasper.

•disk c: collegarsi e pulire disco con tool di windows e a mano (vedere file inutili lasciati in giro)

•memory load: controllare stato in corso della replica di postgres, che può determinare una occupazione anche totale

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

saas-a7 (ftp2)

•all disks: vedere cosa si può cancellare, attivarsi per effettuare espansione del disco della macchina virtuale e dell'lvm

•current load: verificare stato di proftpd e carico attuale

•current user: controllare con attenzione numero di utenti connessi, verificare lastlog

•ftp: controllare stato proftpd e farlo ripartire/ricaricare secondo necessario

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

•ssh: controllare stato del demone e connessioni

•swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

•total processes: controllare processi esistenti

saas-a8 (apollonia)

•current user: controllare con attenzione numero di utenti connessi, verificare lastlog

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

•ssh: controllare stato del demone e connessioni

•swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

•total processes: controllare processi esistenti

saas-a9 (lamp)

•all disks: vedere cosa si può cancellare

•current load: verificare stato di mysql che potremme mandare la macchina in saturazione

•current user: controllare con attenzione numero di utenti connessi, verificare lastlog

•db areagate: controllare lo stato del database mysql, se le slow query sono molte o ci sono molte tabelle aperte sentire i programmatori.

•http: controllare stato di apache

•ping: controllare sui firewall coinvolti lo stato dei tunnel vpn e/o le schede di rete su hypervisor

•ssh: controllare stato del demone e connessioni

•swap usage: tentare comando "free && sync && echo 3 > /proc/sys/vm/drop_caches && free"

•total processes: controllare processi esistenti