This quiz consists of 0 mandatory questions where you can gather 0 points.
You will complete the quiz by answering all the questions and gathering at least 0 points.
Answered: 0 / 0
Achieved points: 0 (NaN %)
Projekt
Podatkovne karte in analiza slik
Projekt je del gradiva za mikrodokazilo Podatkovna analitika in odkrivanje skupin v podatkih na Univerzi v Ljubljani.
Gradivo je na voljo pod licenco Creative Commons CC BY-NC-ND.
Projekt podatkovnih kart in analize slik
1. del: Podatkovne karte
- Podatki: Odprite gradnik Datasets in naložite podatke Telecom customer churn. Podatke opišite (število primerov, število spremenljivk, kaj opisujejo spremenljivke).
- t-SNE: Uporabite t-SNE za izris podatkovne karte. Ne spreminjajte privzetih nastavitev. Izračun bo, zaradi velikega števila primerov, trajal nekaj časa. Priložite sliko celotnega gradnika v poročilo.
- Razlaga: Uporabite gradnik Box Plot ter razložite posamezne gruče v podatkih. Za izbor elipsastih gruč držite tipko Ctrl (Cmd na Mac OS) ter gruči postopoma dodajajte primere. Bodite pozorni, da pravilno prevežete povezavo med gradnikoma t-SNE ter Box Plot! Razlago posameznih gruč zapišite v poročilo ter jo podkrepite s slikovnim gradivom.
- Delotok: Na koncu poročila za prvo nalog dodajte sliko celotnega delotoka.
Primer pravilnega delotoka na podatkih Attrition.
2. del: Analiza slik
- Podatki: Na spletu ali na svojem računalniku poiščite vsaj 100 slik. Uredite jih v 3-5 map, ki naj predstavljajo tematike slik (npr. gore, morje, mesto). Slike opišite z besedami ter opis podkrepite s prikazom slik v gradniku Image Viewer (slike naj ne bodo strogo zasebne narave, saj jih bomo ocenjevalci pregledali).
- Vložitve: Slike predstavite s številskim opisom.
- Gručenje: Gručite slike s tehniko hierarhičnega razvrščanja v skupine. Bodite pozorni, da pred hierarhičnim gručenjem izračunate razdalje. Uporabite kosinusno razdaljo, saj delamo z visokodimenzionalnimi podatki!
- Razlaga: Razložite gruče tako, da izberete posamezno gručo ter izbrane slike pogledate v gradniku Image Viewer.
- Karte: Uporabite gradnika t-SNE in PCA (v kombinaciji s Scatter Plot) ter primerjajte podatkovni karti. Komentirajte kvaliteto obeh vizualizacij glede na izbrane kategorije. Za lažjo orientacijo točke v obeh grafih pobarvajte glede na oznake podmap (category). V poročilo dodajte sliki obeh grafov in komentar.
- Delotok: Na koncu poročila za drugo nalog dodajte sliko celotnega delotoka.
Primer pravilnega delotoka na slikah različnih pasem psov.
Pogledate si lahko tudi vzorčni primer poročila.