HomeProjekt

This quiz consists of 0 mandatory questions where you can gather 0 points.
You will complete the quiz by answering all the questions and gathering at least 0 points.

Answered: 0 / 0

Achieved points: 0 (NaN %)

Projekt

Podatkovne karte in analiza slik

Projekt je del gradiva za mikrodokazilo Podatkovna analitika in odkrivanje skupin v podatkih na Univerzi v Ljubljani.

Gradivo je na voljo pod licenco Creative Commons CC BY-NC-ND.

Projekt podatkovnih kart in analize slik

1. del: Podatkovne karte

  1. Podatki: Odprite gradnik Datasets in naložite podatke Telecom customer churn. Podatke opišite (število primerov, število spremenljivk, kaj opisujejo spremenljivke).
  2. t-SNE: Uporabite t-SNE za izris podatkovne karte. Ne spreminjajte privzetih nastavitev. Izračun bo, zaradi velikega števila primerov, trajal nekaj časa. Priložite sliko celotnega gradnika v poročilo.
  3. Razlaga: Uporabite gradnik Box Plot ter razložite posamezne gruče v podatkih. Za izbor elipsastih gruč držite tipko Ctrl (Cmd na Mac OS) ter gruči postopoma dodajajte primere. Bodite pozorni, da pravilno prevežete povezavo med gradnikoma t-SNE ter Box Plot! Razlago posameznih gruč zapišite v poročilo ter jo podkrepite s slikovnim gradivom.
  4. Delotok: Na koncu poročila za prvo nalog dodajte sliko celotnega delotoka.

Primer pravilnega delotoka na podatkih Attrition.

2. del: Analiza slik

  1. Podatki: Na spletu ali na svojem računalniku poiščite vsaj 100 slik. Uredite jih v 3-5 map, ki naj predstavljajo tematike slik (npr. gore, morje, mesto). Slike opišite z besedami ter opis podkrepite s prikazom slik v gradniku Image Viewer (slike naj ne bodo strogo zasebne narave, saj jih bomo ocenjevalci pregledali).
  2. Vložitve: Slike predstavite s številskim opisom.
  3. Gručenje: Gručite slike s tehniko hierarhičnega razvrščanja v skupine. Bodite pozorni, da pred hierarhičnim gručenjem izračunate razdalje. Uporabite kosinusno razdaljo, saj delamo z visokodimenzionalnimi podatki!

  1. Razlaga: Razložite gruče tako, da izberete posamezno gručo ter izbrane slike pogledate v gradniku Image Viewer.

  1. Karte: Uporabite gradnika t-SNE in PCA (v kombinaciji s Scatter Plot) ter primerjajte podatkovni karti. Komentirajte kvaliteto obeh vizualizacij glede na izbrane kategorije. Za lažjo orientacijo točke v obeh grafih pobarvajte glede na oznake podmap (category). V poročilo dodajte sliki obeh grafov in komentar.
  2. Delotok: Na koncu poročila za drugo nalog dodajte sliko celotnega delotoka.

Primer pravilnega delotoka na slikah različnih pasem psov.

Pogledate si lahko tudi vzorčni primer poročila.