A nagy számok örvénye

>!Bence AP

Emlékszem még, milyen volt a Moly az indulásnál. Egyszerű szolgáltatás, amellyel nyomon lehetett követni, hogy mit olvasnak az ismerőseim. Ha valaki befektetőkkel tárgyal, akkor pont egy ilyen egymondatos leírásra van szüksége. Vagy egy jó hasonlatra, például hogy „a Moly a könyves Facebook”. Még ha persze néhány főbb jellemzőjében nem is.

Antoine de Saint-Exupéry írta több mint fél évszázada a tervezésről Az ember földje című könyvében, hogy „…nem akkor érkezünk el a tökéletességhez, amikor már nem lesz mit hozzátennünk, hanem akkor, mikor már nem lesz mit elhagynunk. Fejlődése teljén a gép szinte elrejtőzik.” A fókuszált, egy feladatot kifogástalanul ellátó termék mindig jobb, mint egy sok mindenre képes. Vagyis esetünkben sokkal inkább lehet jó egy könyves Miso, mint egy könyves IMDb.

A Molyt viszont magával ragadta a nagy számok örvénye. A tagok elképesztően sok adatot töltenek fel könyvekről, így már nem opció számunkra az egyszerű szolgáltatás, amely csak olvasmányok nyilvántartására szolgál. Például az idézetek csak egy szeletét jelentik a rendszernek, de már így is háromszor annyi található nálunk, mint az általam ismert legnagyobb magyar idézetgyűjtő oldalon, a Citatumon. És ez a fajta felhasználói lelkesedés úgy tűnik, olyan, mint egy nagy folyó: nem lehet megállítani, de jól kiépített gát- és csatornarendszerrel termőföldet lehet öntözni vele.

Már három évvel ezelőtt is létezett a vízió, hogy az idézetek egyfajta tudásbázis alapját képezzék. A polcok felépítése – szinte bármit lehet rárakni, nem csak könyvet – is azt a célt szolgálta, hogy a rendszerező elme előtt ne legyen technikai akadály, ha kreatív problémákat akar megoldani. Akkoriban csináltam is egy polcot Hemingway Párizsban címmel, amely az írónak a Vándorünnep című könyvében említett helyszínek közül tartalmaz néhányat.

Idén nyáron azonban kísérletet teszünk arra, hogy ezt a szemléletet egy szinttel mélyebben a rendszerbe ágyazzuk, és az idézetekből strukturált adatforrásokat építsünk fel.

Így könnyen lekérdezhetőek lennének, hogy egy adott könyv mely helyszíneken és időpontokból játszódik, vagy éppen fordítva, hogy egy adott helyszín és időpont mely könyvekben szerepel. Aztán ugyanez személyekkel, tárgyakkal…

A Google nemrég jelentette be Knowledge Graph nevű fejlesztését, amelyik jórészt a gépi intelligencia segítségével bányássza ki a weboldalakból az egymáshoz kapcsolódó információkat. Én pedig úgy látom, hogy a tagjaink örömmel vennének részt – a régi jó módszereket felhasználva – a mostaninál komplexebb könyves világ felépítésében…

12 hozzászólás