How Google manages data.
1. Collect
MapReduce doesn’t depend on a traditional structured database, where information is categorized as it’s collected. We’ll just gather up the full text of every book Google has scanned.2. Map
You write a function to map the data: “Count every use of every word in Google Books.” That request is then split among all the computers in your army, and each agent is assigned a hunk of data to work with. Computer A gets War and Peace, for example. That machine knows what words that book contains, but not what’s inside Anna Karenina.3. Save
Each of the hundreds of PCs doing a map writes the results to its local hard drive, cutting down on data transfer time. The computers that have been assigned “reduce” functions grab the lists from the mappers.4. Reduce
The Reduce computers correlate the lists of words. Now you know how many times a particular word is used, and in which books.5. Solve
The result? A data set about your data. In our example, the final list of words is stored separately so it can be quickly referenced or queried: “How often does Tolstoy mention Moscow? Paris?” You don’t have to plow through unrelated data to get the answer.
Wired
Fuente: lickystickypickywe
73 Notes/ Hide
-
A johnmichel le gusta esto
-
A ifonearth le gusta esto
-
jazmokology ha reblogueado esto desde shaneguiter
-
betacar ha reblogueado esto desde proofmathisbeautiful
-
A icantreadpoetry le gusta esto
-
A superrrsara le gusta esto
-
A loichay le gusta esto
-
A ianultra le gusta esto
-
flyonair ha reblogueado esto desde dans-ce-pot
-
dans-ce-pot ha reblogueado esto desde proofmathisbeautiful
-
A marukido le gusta esto
-
A aubreymcfato le gusta esto
-
A cloois le gusta esto
-
A feeqahaballah le gusta esto
-
A atomic-oxygen le gusta esto
-
A s0leful0ne le gusta esto
-
mohammednasim ha reblogueado esto desde lickystickypickywe
-
A herheartdances le gusta esto
-
A sedso le gusta esto
-
pixiesuicide ha reblogueado esto desde proofmathisbeautiful
-
azfarmukmin ha reblogueado esto desde lickystickypickywe
-
vovomark ha reblogueado esto desde proofmathisbeautiful
-
A borderingoninsanity le gusta esto
-
A macmankev le gusta esto
-
A redcloud le gusta esto
-
5hane ha reblogueado esto desde shaneguiter y ha añadido:
I was just reading about this the other day. Map/Reduce and BigTable are really cool. Reminds me of using a botnet to...
-
A 5hane le gusta esto
-
shaneguiter ha reblogueado esto desde danimunoz
-
A webbo le gusta esto
-
ublockedmeonfacebook ha reblogueado esto desde lickystickypickywe
-
A rollsofrice le gusta esto
-
A amandamaries le gusta esto
-
cingulomania ha reblogueado esto desde proofmathisbeautiful
-
A yo-yoyosh le gusta esto
-
A alabagazoonto le gusta esto
-
A teamlimabean le gusta esto
-
A dlbsandwich le gusta esto
-
firesaw ha reblogueado esto desde proofmathisbeautiful
-
A wildorchidz le gusta esto
-
A wordcard le gusta esto
-
A aircount-brusherfeit le gusta esto
-
A omg le gusta esto
-
A kaching le gusta esto
-
A messymorsels le gusta esto
-
roomthily ha reblogueado esto desde proofmathisbeautiful
-
A tomorrowsneverdie le gusta esto
-
proofmathisbeautiful ha reblogueado esto desde lickystickypickywe
-
leopardsblog ha reblogueado esto desde lickystickypickywe
-
enoughthunder ha reblogueado esto desde lickystickypickywe
-
A feedwell le gusta esto
- Mostrar más notas
