Monthly Archives: maggio 2012

0

crawler

un crawler deve essere scalabile, ovvero il programmatore deve capire bene quali sono i suoi limiti. Per fare ciò dobbiamo capire come funziona un crawler. Esso, sostanzialmente, è formato da diversi moduli che cooperano tra loro. – iniziamo con l’URL frontier, che contiene gli url che non sono ancora stati controllati dal crawler (se si…

FACEBOOK: POCHI GIORNI DAL DEBUTTO IN BORSA
0

occhio alla Borsa!

cara Facebook, non era proprio il matrimonio in borsa che ti aspettavi. L’evento informatico-mondano che ha tenuto gli investitori (e i programmatori) con il fiato sospeso è stato il momento in cui Zuckerberg risuonava la campana, ufficializzando così l’entrata in Borsa del Social Network più amato dai teenagers, più odiato dagli attivisti per la privacy,…

0

nuove proposte per il dopo-Diginotar

Dopo lo scandalo Diginotar, avvenuto agli inizi dell’autunno 2011, i ricercatori e gli esperti di sicurezza hanno cercato vari modi per non decretare in maniera frettolosa la fine del protocollo SSL.Sono circa 650 le certificate autorithy in tutto il mondo che emettono certificati di sicurezza, che a loro volta saranno gestite dai browser contenuti nel…

0

Vector space model

senza l’uso dei metadati, i documenti possono essere visti come semplici “sequenze di termini”, e invece possiamo codificare informazioni importanti come l’autore o il titolo di una serie di documenti con il rispettivo indice parametrico. Con “zona” intendiamo la parte di documento che contiene il testo libero. Per facilitare la ricerca dovremmo costruire degli indici…

0

guida all’uso di corpora – parte 4

Corpora nella stilistica e nei testi linguistici Gli studiosi, in questo caso, sono più interessati alle singole caratteristiche dell’autore che a quelle contenute in una certa varietà di linguaggio. Cosa definiamo per “stile di un autore” e come possiamo applicare questo concetto alla linguistica? Ci basiamo innanzitutto sul suo vocabolario, sui termini utilizzati per esprimere…

0

guida all’uso di corpora – parte 3

Corpora nella sociolinguistica Molti progetti sociolinguistici su corpora sono state delle semplici ricerche lessicali nello studio del linguaggio e del genere: un esempio di questi è lo studio di Kjellmer (1986), che sui corpora Brown e LOB ha studiato gli appellativi (whois), in base al sesso. Egli guarda in maniera specifica alle occorrenze degli elementi…

0

Knowledge

Ieri Google ha presentato tramite un post sul suo blog ufficiale (e re-postato in quello specifico sul search)”Knowledge Graph“, il prototipo di quello che si programma essere come “progetto di ricerca semantica” in cui query e stringhe non sono più viste solo come un insieme di bit, ma veri e propri oggetti(things) collegati tra loro…

0

Guida all’ uso di corpora – parte 2

Corpora per la pragmatica e l’analisi del discorso L’analisi del discorso è un’altra area dove i corpora standard sono stati poco utilizzati. Questo perchè gli analisti di questo campo sono più propensi a studiare la relazione che corre tra certe pratiche sociali e certe pratiche discorsive. Tuttavia, nell’ultimo decennio sono state sviluppati alcuni “punti di…

0

Guida all’uso di corpora – parte 1

Corpora e semantica nella semantica lessicale vengono già usati metodi quali la determinazione delle co-occorrenze delle parole individuali. Ed è infatti da questo tipo di misure che si determina la semantica di un certo genere letterario, o più semplicemente della semantica di un linguaggio. Il primo ruolo importante del corpus, come dimostrato da Mindt nel…

SpySheriffPopUp
0

scare!

Esiste un tipo di malware chiamato dagli esperti “ransomware” o “scarware“.Il neologismo deriva dai termini inglesi “ware” (riscatto) e “scare” (paura), chi ha la sfortuna di incontrare questo tipo di software si ritrova davanti una mail che gli “suggerisce” di pagare immediatamente una somma di denaro in merito ad un fittizio comportamento illecito da parte…