Рударење података

Циљ и исход предмета

Стицање теоретских знања и практичних вештина у области рударења података Студент разуме основне концепте, принципе и методе рударења података и уме да примени различите технике имплементације рударења података у решавању реалних проблема.

Теоријска настава

Појам рударења података и области примене. Веза са осталим областима рачунарских наука - машинско учење, базе података, аналитика података, статистика. Фазе у пројекту рударења података. Припрема података - чишћење, трансформација, редукција, дискретизација и генерисање хијерархије концепата. Представљање знања. Анализа оријентисана ка атрибутима. Алгоритми рударења података - правила асоцијације, класификација, предикција. Кластеровање. Напредне технике рударења података - рударење текста, Бајесов приступ класификацији текста. Рударење на вебу - класификација веб страница, екстракција знања из веб страница.

Практична настава

Илустрација препреме података за обраду на изабраном реалном скупу података у специјализованом развојном окружењу за рударење података. Приказ поступка филтрирања података, трансформације и дискретизације. Приказ визуелизације података у изабраном развојном окружењу. Вежба примене статистичких израчунавања над изабраним скупом података. Илустративни примери коришћења правила асоцијације. Приказ репрезентативних примера техника рударења података: класификације (стабло одлучивања), предикције и кластеровања. Тестирање изабраних техника. Израда пројекта са применом различитих техника рударења података на реалним податацима и извлачење што прецизнијег модела података.