A7B36VYD: Vytěžování dat

( domů | přednášky | cvičení )

Oznámení: Výsledky zkoušky 24.1 budou k dispozici 25.1 od 11:00 v místnosti KN:E-128. Pokud se nemůžete dostavit, zeptejte se na výsledek emailem (zelezny@fel.cvut.cz).

Anotace

Cílem předmětu je seznámit studenty se základy vytěžování dat (data miningu). Studenti se postupně seznámí se základními úlohami vytěžování dat, odhady parametrů pomocí pravděpodobnosti. Dále se základními metodami shlukové analýzy a metodami vyhodnocení úspěšnosti shlukování, vyhledávání častých množin a sekvencí. Poté se studenti seznámí se základy klasifikace (Bayesovský klasifikátor), následovat budou složitější klasifikační metody - rozhodovací stromy, lineární klasifikace, perceptron a dopředné neuronové sítě. Posledními tématy bude testování vytvořených modelů a kombinování modelů.

Cvičení a zápočet

Cvičení budou probíhat konzultační formou. Jejich obsah budou tvořit především dotazy na probranou látku a zadané úlohy. Pro sběr dotazů studenty vybízíme k využití fóra předmětu.

Na začátku každého cvičení bude zadána jedna zápočtová úloha týkající se látky z poslední přednášky. Z každé úlohy se vypracovává krátký protokol, rozsahem přibližně jedna strana A4. Termín jeho odevzdání do upload systému je stanoven na půlnoc z pondělí na úterý následujícího týdne.

Za protokoly se udílí až 5 bodů, které si student odnáší ke zkoušce. Úspěšné splnění úkolu posuzuje cvičící systémem „splnil/nesplnil“; o bodové hodnocení tedy nelze smlouvat. V případě, že protokol splňuje obsahové požadavky, ale nesplňuje požadavky formální, může cvičící protokol přijmout se sníženým bodovým ohodnocením.

  • Pokud je úloha splněná s týdenním zpožděním, maximální počet bodů se snižuje na 2.
  • Při zpoždění o další týden již není možné získat bodové ohodnocení, avšak úlohu stále lze odevzdat a úspěšně splnit.
  • Jakmile dojde k překročení i této lhůty (zpoždění 2 a více týdnů), student ztrácí možnost získání zápočtu.
  • Povinnou součástí protokolů jsou všechny použité zdrojové kódy, které nebyly dodány se zadáním úlohy.

Zápočet se udílí za úspěšné splnění všech zadaných úloh.

Zkouška

Zkouška bude probíhat formou písemného testu. Maximálně můžete získat 45 bodů. Abyste uspěli, musíte získat minimálně 20 bodů. Test se bude skládat z otázek, na které budete odpovídat zaškrtnutím správných odpovědí (správně může být 0 až N odpovědí). Druhou částí testu budou otázky, které budou vyžadovat odpověď ve “volném textu”. Volný text zda znamená odpověď na otázku, nakreslení obrázku apod.

Výsledná známka se uděluje na základě součtu bodů ze cvičení a ze zkoušky podle následující tabulky.

ECTS známka A B C D E F
Počet bodů 100-90 89-80 79-70 69-60 59-50 50-0

Pokud vám bude chybět 3 nebo méně bodů k lepší známce, nebo dosáhnete mezi 17-19 body z písemného testu, můžete přijít na ústní přezkoušení a pokusit se potřebné body získat. Ústní přezkoušení bude následovat po oznámení výsledků písemné zkoušky.

Zkouškové termíny jsou:

  • 5.1.2012 v 9:00, KN:E-127
  • 16.1.2012 v 11:00, KN:E-107
  • 24.1.2012 v 10:30, KN:E-301
  • 3.2.2012 v 10:00, KN:E-301

Odkazy

Literatura

  • Jiří Lažanský, Vladimír Mařík a Olga Štěpánková: Umělá inteligence (1), Academia 2000
  • Petr Berka: Dobývání znalostí z databází, Academia 2005
  • Richard O. Duda, Peter E. Hart, David G. Stork: Pattern Classification, Wiley Interscience 2001

Učitelé

 
/www/pages/data/pages/courses/a7b36vyd/start.txt · Last modified: 2012/01/24 14:24 by cernorad