Kārlis Čerāns Prof. Dr.dat.
E-mail: Karlis.Cerans@lumii.lv
Internet: http://www.ltn.lv/~karlisc

Studentu darbu tēmas

Sekojošās tēmas ir piemērotas maģistra darbu izstrādei, var tikt pielāgotas arī izpētei bakalaura darba ietvaros. Daļai no tām var būt (protams, ja ir tāda vēlēšanās) arī tālākas padziļinātas izstrādes iespējas, piemēram, doktorantūras ietvaros.

Aktuālās tēmas 2022./2023.g:

1. Atvērto saistīto datu (Linked Open Data) struktūras analīze
Atvērtie saistītie dati ir tīmeklī pieejamu atvērtu, savastarpēji saistītu, RDF formātā strukturētu datu kopu kopums (katrs no mazajiem aplīšiem diagrammā apzīmē vienu datu kopu). Katrai no datu kopām ir savs autors/veidotājs, un arī šīs kopas, kaut arī visas atbilst RDF formātam, var būt strukturētas dažādos veidos. Darba virs-mērķis ir izstrādāt metodi, kas ļautu gala lietotājam noskaidrot pamata informāciju par katra saistīto datu avota saturu (vispirms - struktūras ziņā - kādas ir izmantotās klasifikācijas metodes, kādas ir datu klases, utt.), un tālāk arī ieskatīties dziļāk šajās datu kopās. Sākotnējā posmā (kas jau varētu būt pietiekams noslēguma darbam) interesanti varētu būt iegūt kādu statistiku par saistīto datu mākonī iesaistītajām datu kopām, to apjomu,  strukturizācijas metodēm, klašu skaitu, utt. Interesantas ar šo virzienu saistītas tēmas var būt vairākas.

2. Datu shēma kā zināšanu grafs
ViziQuer rīks piedāvā iespējas veidot vizuālus vaicājumus pār dažādiem RDF formā strukturētiem datu avotiem. Lai rīks darbībā pār kādu datu avotu varētu piedāvāt izveidotās vaicājuma diagrammas un tajā ietvertā teksta auto-turpinājumus, kam ir jēga jau izveidotās diagrammas daļas kontekstā, rīka atbalstam ir uzkrāta shēmas informācijas (kādas ir klases, saites un atribūti, kā tie savā starpā saistās). Esošais tehnoloģiskais risinājums ietver datu shēmas uzturēšanu relāciju datu bāzē. Lai atvieglotu vizuālo vaicājumu rīka izmantošanu semantisko tehnoloģiju kontekstā, noderīga būtu arī datu avota shēmas pārkodēšana zināšanu grafa veidā RDF formātā. Tas atvieglotu rīka portējamību (nebūtu vajadzīgs uzstādīt relāciju DB vadības sistēmu), kā arī shēmas datus būtu iespējams analizēt ar tām pašām metodēm (t.sk. ar vizuālajiem vaicājumiem, kā arī veicot salīdzinošo analīzi), kā oriģinālos datus. Datu shēmu ir iespējams tālāk izmantot arī tekstuālo SPARQL vaicājumu auto-turpinājumu piedāvāšanā.

3. Vizuāli rezultāti vizuāliem vaicājumiem
Datu attēlošana vizuālā veidā var būtiski atvieglot to uztveramību, kā arī ilustrēt nozīmīgas datos esošās sakarības, līdz ar to datu vizuālā prezentācija ir plaši pētīts jautājums. Vizuālo vaicājumu rīks ViziQuer šobrīd piedāvā vizuālu metodi paša vaicājuma izveidei, tomēr vizuāla datu prezentācija var būt ne mazāk būtiska. Iecerētais darba uzdevums ir integrēt pieejamās vizuālās vaicāšanas un vizuālās rezultātu attēlošanas metodes, tajā skaitā piedāvājot iespējas lietotājam izvēlēties katrai datu atlases situācijai piemērotākās vizualizācijas, tomēr piedāvājot arī sākotnējās / noklusētās vizualizācijas metodes, kas balstās uz vaicājuma rezultātā atlasīto datu īpašībām.

4. Multi-modāli datu vaicājumi
Tā kā tekstuālā standarta SPARQL valoda vaicājumu veidošanai pār RDF datubāzēm var nebūt piemērota izmantošanai lietotājiem bez padziļinātām IT zināšanām, ir izveidotas virkne pieeju un rīku, lai atvieglotu gala lietotāju iespējas datu piekļuvei. Populāra pieeja ir izmantot dabiskās valodas teksta fragmentus (piemēram, SPARKLIS rīkā), cita pieeja ir balstīta uz vizuālu diagrammu izmantošanu vaicājumu veidošanā (piemēram, OptiqueVQs, RDF Explorer vai ViziQuer rīki). Katrai no pieejām ir savas stiprās un savas vājās puses. Piedāvātās tēmas ideja ir izveidot sistēmu, kurā gala lietotājam veidojamai vaicājums pār datiem ir pieejams caur dažādām atbalsta metodēm. Piemēram, lietotājs varētu izveidot vaicājumu SPARKLIS rīkā, bet pēc tam aplūkot arī šī vaicājuma vizuālo prezentāciju. Liela daļa no tehnoloģijām, kas šādam risinājumam ir vajadzīgas, ir pieejamas, piemēram, balstoties uz metodēm dota SPARQL vaicājuma vizualizācijai ViziQuer rīkā.

5. Dabiskās valodas vaicājumu vizualizācija
Vaicājumu atbildēšana pār zināšanu bāzēm piedāvā iespēju saņemt informāciju no tām, balstoties uz dabiskajā valodā (piemēram, angļu) veidotiem vaicājumiem, kas tiek iegūta, vispirms dabiskās valodas vaicājumu translējot uz SPARQL un pēc tam šo SPARQL vaicājumu izpildot. Ņemot vērā dabiskās valodas brīvo struktūru, pastāv iespējamība, ka sistēmas uzģenerētais SPARQL vaicājums nebūs atbilstošs lietotāja sākotnējai iecerei, un līdz ar to iegūtais rezultāts būs nepareizs, un lai šo "nepareizību" konstatētu, lietotājam ir jāskatās uzģenerēto SPARQL kodu, kas var būt pieņemami tikai cilvēkiem ar noteiktām prasmēm. Šīs tēmas ietvaros paredzēts darbs sakombinēt SPARQL vaicājumu ģenerēšanu no dabiskās valodas teksta ar sekojošu SPARQL vaicājumu vizualizāciju vizuālo vaicājumu sistēmas ViziQuer ietvaros, tādējādi iegūstot vizuālu sākotnējā dabiskās valodas vaicājuma attēlojumu, kas gala lietotājam varētu būt jau saprotamāks.

Šīs tēmas ietvaros iespējami arī vienkāršāki darbi, piemēram, vizuālā vaicājuma sākotnējā karkasa ģenerēšana, balstoties uz esošā dabiskās valodas tekstā iekļautiem atslēgas vārdiem.

6. Teksta auto-turpinājumi SPARQL vaicājumu veidošanā
Darba ietvaros izveidojams rīks, kas piedāvā no konteksta atkarīgu teksta turpinājumu priekšā-teikšanu SPARQL vaicājuma veidošanas laikā. Nepieciešams iepazīties ar esošajām teksta turpinājumu priekšā-teikšanas iespējām, kas izmantojamas SPARQL vaicājumu veidošanas kontekstā, jānovērtē to atkal-izmantošanas iespējas. Auto-turpinājumu rīka veidošanai var tikt veidota sadarbība ar datu shēmas serveri, kas ļauj iegūt jau uzrakstītajā vaicājuma daļā ietverto entitāšu (klašu, īpašību) konteksta informāciju, no kuras ir jāizvēlas piemērotie vaicājuma turpinājumi.

7. Diagrammatiski vaicājumi pār dažādu formātu datubāzēm (piemēram, grafu, dokumentu datubāzēm, u.c.).
ViziQuer piedāvā vizuālu vaicājumu veidošanas iespēju pār semantiskājām datubāzēm (datubāzēm RDF formātā), nodrošinot vizuālo/diagrammatisko vaicājumu tulkošanu uz vaicājumiem tekstuālā SPARQL sintaksē. Izveidojot / nodefinējot cita formāta datubāzes datiem atbilstību ar RDF formātu, var būt iespēja vizuālos vaicājumus tulkot uzreiz uz vaicājumu valodu, kas darbojas pār šī formāta datubāzēm.

Labprāt konsultēju/vadu studentus arī par citām viņu pašu izvēlētām vai kopīgi sarunā izveidotām tēmām saistībā ar: