Klepetalniki

Klepetalniki

Gradnja domensko usmerjenih klepetalnikov s podporo citiranju in posodabljanju znanja.

V okviru tem na področju klepetalnikov nas zanima, ali je možno narediti klepetalnik za izbrano področje, ki ga predstavimo z izbranim naborom dokumentov. Klepetalnik bi radi razvili tako, da ta pri pogovoru in odgovorih na naša vprašanja uporablja besedilo iz našega nabora dokumentov in dokumente ali dele dokumentov pri tem navaja (citira). Ciljamo sicer na klepetalnike, ki so na primer specializirani za določena zelo ozka področja, kot so na primer dnevne novice, molekularna biologija, bioprocesi (tu sodelujemo s podjetjem Novartis), ali pa pravni dokumenti.

Naloga bi torej vsebovala:

  • zbiranje podatkov (dokumentov) in ureditev teh v korpus
  • ustrezno indeksiranje dokumentov
  • razvoj klepetalnika
  • vključevanje nebesedilnih dokumentov v klepetalnik (podatki, tabele, grafi, uporaba napovednih modeliv)
  • vrednotenje rešitve (na vseh nivojih, tudi pri RAG, na primer, nas zanima, katero tehniko izbora dokumentov ali podatkov bi lahko uporabili)

Ena od tem na tem področju je tudi dopolnitev oziroma urejevanje nove edicije knjige Dictyostelium: Evolution, Cell Biology, and the Development of Multicellularity, ki je bila objavljena v letu 2001 in je danes že malce zastarela. Imamo izvorno besedilo knjigo, željo avtorja po sodelovanju, sodelujemo pa tudi z najboljšimi raziskovalci na tem področju, ki so to temo tudi predlagali. Zanima nas, ali je moč zgraditi sistem, ki bi knjigo "prebral" in na podlagi nedavnih objav člankov s področja predlagal ustrezne popravke in dopolnitve.