start | find | index | login or register | edit
2001-05-02
by earl, 6070 days ago
hoechst interesseant: http://www.langreiter.com/space/k.r - und schoenerweise auch hoechst nuetzlich! in 2-3 monaten werde ich dann hoffentlich auch endlich zeit haben, mich in die untiefen des 'intelligenten' computings zu stuerzen - solche hilfsmittel sind dann schon sehr willkommen.

mining unstructured data sets
LSI = latent semantic indexing. hmm. hmm. hmm.
SVD = singular value decomposition; just for the record.

das problem scheint doch quite offensichtlich zu sein: aus dem semantic web wirds so bald mal nichts und sogar wenn, es bestehen berge von rein textuellen datenbestaenden. kein markup, kein nichts. und nun lasset die versammelte computerschaft in ihrer rechenleistung unterstuetzt von menschlicher intelligenz antreten, um aus diesen unmengen von daten auch information oder sonstige lustige dinge zu gewinnen.

oder?

Zwei IBM Researcher fassten dies 1999 so zusammen:
Unstructured text documents are becoming increasingly common and available; mining such data sets represents a major contemporary challenge.

der offizielle ausdruck fuer die beschriebene taetigkeit scheint document bzw. text mining zu sein. zusammengefasst wird das offensichtlich alles unter dem schoenen acronym IR fuer Information Retrieval.

-- A Survey On Web Information Retrieval Technologies
-- An Overview of Document Mining Technology
-- Data Mining on Symbolic Knowledge Extracted from the Web

-- Text Mining -- Knowledge extraction from unstructured textual data
-- Text Mining: Natural Language techniques and Text Mining applications
-- Text Data Mining

von interesse sind da vielleicht auch die beiden herren Dieter Merkl und Andreas Rauber - ihrerseits taetig am Institut fuer Softwaretechnik an der TU Wien. ansatzmaessig kommen sie aus dem Fuzzy/ANN bereich, duerften daher auch exzellente mathematiker sein. gemeinsame interessensbereiche der beiden liegen im Information Retrieval und im Data Mining. links zu den publikationen sind im jeweiligen snip.
powered by vanilla
echo earlZstrainYat|tr ZY @.
earl.strain.at • esa3 • online for 6128 days • c'est un vanilla site