HTTP-ANALYZE 2.0  INTERPRETAZIONE DEI RISULTATI
Amadeux Multimedia & 9NetWeb

Statistiche del sito (www.vsdominio.xxx/stats)

esempio di statistiche relative ad Amadeux.it


Il report delle statistiche contiene queste informazioni:

  • il totale degli hits, 304's, files, pageviews, sessions, dati inviati (in KB)
  • il totale dei  dati richiesti, trasferiti, e salvati in cache (in KB)
  • il numero di URLs, sites, e sessions per mese
  • il numero di tutte le risposte del Server Web con codice 200 (OK)
  • la media degli hits per settimana
  • la media degli hits per giorno e per ora
  • il numero of hits, files, 304's, sites, dati inviati al giorno
  • I primi 5 giorni, 24 ore, 5 minuti e 5 secondi del "summary period" (2)
  • i primi 30 clienti che hanno avuto accesso al vostro sito più frequentemente
  • La seguente tabella riassume il significato dei termini utilizzati nel report statistiche:

    Termine

    Colore

    Descrizione

    Hits

    green

    Un hit indica la risposta inviata dal server su richiesta inoltrata da un browser. E' inclusa ogni risposta risposta inviata dal server quindi non solo  file di testo o documenti. Se, per esempio, una pagina HTML ha due  immagini incluse, qualora la pagina venisse richiesta il server andrebbe a generare tre hits: uno per la pagina HTML e due hits per le due immagini incluse.

    Files

    green

    Se l'utente Internet richiede un documento e il server completa con successo il suo invio, le statistiche registreranno un "Files" come "Code 200 (OK). Ogni singola risposta viene conteggiata come un file. "File" in questo caso significa ogni tipo di file.

    Code 304

    yellow

    Code 304: questa risposta è generata dal server se un documento non è stato aggiornato dall'ultima volta che è stato richiesto dall'Utente Internet.  Ciò accade quanto il browser (o la cache di un proxy server tra il browser e il vostro Server Web) ha ancora una copia aggiornata della pagina nella sua memoria locale (cache) e quindi può visualizzare la pagina senza richiederne i contenuti al Server Web. Questa tecnica è usata per ridurre il traffico nella rete, ma è causa di discrepanze tra quanto indicato nei report delle statistiche e il numero reale di visitatori. 

    Pageviews

    yellow

    Si tratta di tutti i files con estensione .html, .text  o che sono  index files directory. Questo dato permette di stimare il numero  dei "reali" documenti trasmessi dal Server Web. Pageviews non include immagini, CGI script, Java applets o qualsiasi altro oggetto HTML ad eccezione di tutti i files con suffisso .html o .text.

    Other responses

    yellow ¹

    Ci sono molte altre risposte oltre a quelle già analizzate (Code 200/OK o Code304/Not Modified). Per esempio, il Server Web potrebbe generare una risposta con codice 302 (Redirected) se la pagina è stata spostata, o Codice 401 (Unauthorized Request) se l'accesso al documento non è permesso, o Codice 404 (Not found) se la pagina richiesta non sesiste nel server.  Per ulteriori informazioni sui codici di risposta è consigliato visitare HTML specification. Si informa chehttp-analyze non riconosce le richieste HTTP/1.1 come da specifiche RFC2068.

    KBytes transferred

    yellow

    Indica il totale dei dati spediti. Si prenda nota che alcuni server carpiscono la grandezza del documento invece di considerare il reale numero di byte trasferiti. Mentre nella maggior parte dei casi, se l'Utente Internet interrompe la trasmissione prima di aver completato il download, alcuni server (per esempio tutti Netscape Server Web) non registrano l'ammontare dei dati trasferiti, ma l'ammontare dei dati che sarebbero stati trasferiti se l'Utente avesse completato il download.

    KBytes requested

    yellow ¹

    Indica il totale dei dati richiesti durante un dato periodo (un anno). Il servizio di http-analyze calcola questo dato sommando KBytes transferred e KBytes saved by cache (vedi sotto).

    KBytes saved by cache

    yellow ¹

    Indica il totale dei dati salvati attraverso diversi modi correlati alla memoria cache quali proxy servers o browsers. Questo valore è ottenuto moltiplicando il numero dei Code 304 (Not Modified) di un determinato file con la dimensione del file stesso. Nota: il servizio di http-analyze può determinare la dimensione del file solo se il file è stato richiesto almeno una volta nello stesso "summary period" (che nel nostro caso corrisponde ad un anno di calendario). Si indica inoltre che il valore per i KBytes saved by cache e KByte requested è un dato approssimativo.

    Unique URLs

      

    Unique URLs si tratta del numero di tutti gli URL richiesti i un dato periodo (un anno). Questo mostra il numero di tutti i diversi files richiesti almeno una volta nel corso del summary period (1anno).

    Unique sites

      

    E' la somma che indica l'unico accesso di un determinato utente durante un dato periodo (time-window). Il time-window è cablato sulla lunghezza del corrente mese. Ciò significa che se un Utente accede al sito in modo frequente, di tutti gli accessi da questo effettuati solo uno verrà registrato nel file log del mese corrente. 

    Sessions

    yellow

    Simile al dato unique sites, questo è il numero di accessi realizzati da un unico utente nel corso di un dato tempo (time-window)  Essendo il "Time-window" tutti gli accessi di uno stesso Utente eseguiti nel corso delle due ore vengono accorpati insieme e considerati come unico accesso.

    ¹ E' possibile visualizzare questo dato solo nella pagina "total summary".
    (2)
    E' l'anno che si sta visualizzando.

    Importante:    L’aggiornamento/elaborazione dei dati viene effettuato ogni 7 giorni circa!
                        Potete vedere la data di aggiornamento in fondo ad ogni pagina.

    Attenzione! 
    Al fine di gestire al meglio lo spazio del Server Web dove siete ospitati, è stato necessario implementare un controllo sulle dimensioni del file .log presente in ogni IP nella sottocartella logs. 
    A tal proposito, dal mese di settembre 2000, sarà attivo uno script che alla fine di ogni mese andrà a compattare il file access del mese appena trascorso. Tale file zippato rimarrà a disposizione dell'utente che avrà così modo di scaricarlo il più agevolmente possibile. 

    Attenzione: il file zippato rimarrà nel server non più di due mesi! Qualora foste interessati a mantenere uno storico delle statistiche, dovrete scaricare il file nella vostra macchina in locale. 

    Segue un esempio pratico di quanto appena indicato: 
    Se per ipotesi oggi stesso fosse il 31 gennaio, il server andrà a zippare il file access del mese di gennaio creando quindi il file jan00.zip. Il file zippato verrà cancellato dopo due mesi dalla sua creazione, quindi, seguendo il nostro esempio, verrà eliminato dal server alla fine del mese di marzo. 

    esempio statistiche relative ad Amadeux.it


    Come si legge il file Log?

    Ogni risposta generata dal server (un invio di files avvenuto con successo, un errore o un timeout)  crea un record nel file di Log, questo record viene denominato HIT. In altre parole, l'ammontare totale degli hits deve equivalere all'ammontare totale dei record nel file di Log.

    Generalmente i record di un formato Logfile comune è il seguente:

    hostname - - [01/Feb/1998:10:10:00 +0100] "GET /index.html HTTP/1.0" 200 4839
    
    "hostname"        : Nome di dominio del sito che ha avuto accesso al server.
    "[01/Feb/1998:10:10:00 +0100]" :  Data di accesso

    "GET/"              : Metodo di richiesta inoltrata da browser

    "index.html/"      : Nome del documento richiesto

    " HTTP/1.0"       : Specifica del protocollo di trasferimento

    "200 4839         : Grandezza del documento

    Eccezioni

    Memoria cache nel browser:

    Non appena la pagina è stata salvata nella cache del browser (memoria temporanea), il browser potrebbe spedire una richiesta al server. Questa richiesta comunica al server che è già presente una pagina nella memoria locale della macchina quindi chiede di inviare dati solo ed esclusivamente se la pagina in questione è stata modificata dall'ultimo upload eseguito da browser. Il questo modo il traffico sulla rete viene ridotto al minimo indispensabile e i documenti vengono trasmessi dal server solo se sono stati aggiornati (e sono presenti nella cache).  Se una richiesta di questo genere viene inoltrata al Server Web, lo stesso invierà una risposta con Codice Code 304 (Not Modified) per indicare che il documento non è cambiato o con un Code 200 (OK) qualora fosse stato cambiato. Dal momento che i browser sono in genere configurati al fine di sfruttare quanto registrato nella cache, potreste non avere un Code 304 se l'utente visita il vostro sito per più volte durante la stessa sessione. Il browser interrogherà direttamente il server solo se l'Utente termina la sessione del browser per riaprirla poi più tardi.


    Cos'è un  Server Web?
    Il Server Web è costantemente connesso alla rete e ha la funzione di eseguire, grazie ad un browser, uno scambio di informazioni con l'Utente Internet. 

    Il colloquio tra server e browser avviene attravero un metodo di comunicazione asincrono chiamato  HTTP (hypertext transaction protocol). Quello che segue vuole essere uno schema del funzionamento del protocollo http:

    1. L'utente Internet digita nella finestra di ricerca del browser un URL
    2. Il browser si connette all'host e richiede uno specifico documento.
    3. Il server web elabora la richiesta e rinvia al browser una risposta:
      1. Se il documento esiste, il server web lo consegna.
      2. Se non esiste o se l'accesso non è permesso, il server web risponde con un messaggio di errore.

    Il documento spedito dal Server Web come risposta alla richiesta inoltrata dal browser può contenere "inline objects". Con "Inline objects" si intendono i links ad un altro sito, immagini, applets, file stream video/audio etc.

    Il browser richiede poi al server tutti gli inline objects della pagina corrente e solo dopo aver ricevuto risposta dal Web Server sarà possibile visualizzare la pagina.

    Questo metodo di comunicazione è chiamato asincrono perchè il browser spedisce molte richieste alla volta (senza aspettare una risposta dal server prima di spedire la richiesta successiva) utilizzando differenti canali di comunicazione.


    Il server elabora contemporaneamente, attraverso diversi processi, più richieste inoltrate dal browser. Questo comporta l'impossibilità di trovare una correlazione tra il numero di accessi registrati nel file di log (numero di persone) e le risposte inviate dal server. 


    Main page  |  esempio statistiche relative ad Amadeux.it