Cosa possiamo trovare su internet ? “Praticamente di tutto” è la risposta che chiunque avrebbe dato e non ha tutti i torti , ma la realtà è che la rete internet comprende molto di più di quello che generalmente vediamo.
Per cercare qualcosa ci appoggiamo solitamente a motori di ricerca come google, yahoo, bing, virgilio, ecc, e statisticamente non andiamo mai oltre la seconda pagina dei risultati scegliendo un link che ci riporta alla notizia da noi cercata.
Il ” deep web “ o italianizzato in ” profonda rete ” è tutto ciò che viene rappresentato da tutti questi siti accessibili attraverso dei moduli di ricerca che comunque non disponibili nell’attuale forma ai motori di ricerca tradizionali o che volutamente non prendiamo in considerazione (vedi il riferimento in neretto sopra)
Spieghiamoci meglio, i più anziani conoscono internet dai primi albori e non storceranno il naso ricordandosi le procedure per accedere a dei documenti era necessario accedere a un primo sito che ci reindirizzava a un secondo il quale aveva una lista di altre destinazioni cui una di esse ci indicizzava dinamicamente nell’archivio di un Hard Disk di una banca dati di deposito trovando così ciò che stavamo cercando.
Una vecchia ricerca del NEC Research Institute insieme a Inktomi (una delle prime ditte di archivi di indirizzi web utilizzato dai principali motori di ricerca acquisita poi interalmente da Yahoo) indicava l’esistenza di un miliardo di documenti statici non più utilizzati e se pensate la quantità di dati che ognuno di noi immette giornalmente (facebook per esempio o un qualsiasi servizio di hosting nonostante le ultime crociate contro di essi.) immaginate quanti dati sono stati immessi negli ultimi 10 anni giusto per fare una stima.
E noi non possiamo accedere normalmente a questo tipo di informazioni proprio per un discorso strutturale, i motori di ricerca si affidano solo alle parole chiave tutto ciò viene definito dall’ azienda BrightPlanet definisce “ surface web ” qui sotto un simpatico disegno vi farà capire meglio.
BrightPlanet ha creato verosimilmente un algoritmo che permette di scandagliare il ” deep web ” e grazie a un sevizio di silos virtuali permette di salvare quelle cose realmente introvabili permettendovi di conoscere le 4 W ” Who , Where, When, What” o utilizzando la lingua madre ” Chi, Dove, Quando e Cosa” informazioni molto importanti sia in campo personale che in campo economico, “conosci il tuo nemico e saprai come sconfiggerlo”.
L’elemento importante da sottolineare è che almeno il 95% del “deep web” è accessibile liberamente ai navigatori della Rete. Sul sito CompletePlanet sono riportati in gran quantità siti, la maggior parte dei quali è praticamente invisibile ai tradizionali motori di ricerca. A titolo esemplificativo, questi sono alcuni dei siti pubblici che compongono il “deep web”:
| Fonte | Dimensioni archivio |
| National Climatic Data Cnter | 366.000 Gb |
| NASA | 219.000 Gb |
| National Oceanographic Data Center | 32.940 Gb |
| MP3.com | 4.300 Gb |
| Amazon | 461 Gb |
| Library Of Congress Online Catalog | 116 Gb |
E questa ricerca è solo sul territorio Nord Americano, provate solo ad immaginare la quantità infinita di dati che possono esserci nel resto del globo, e considerando anche i sistemi “peer-to-peer”, i quali permettono di condividere files tra singoli utenti della rete ci troveremo di fronte ad un ulteriore, incredibile, allargamento delle risorse a cui accedere dal nostro pc.
Una famoso telefilm diceva: La Verità è la Fuori , e anche i file che cercate sono li , da qualche parte.
Buona caccia.


Pingback: Il “deep web” e i file dormienti su internet | Editoriale | WebComunicazioni | Scoop.it