Препознавање и екстракција структуираних података приказних на веб страницама

Абстракт:  У овом раду предложен је метод за аутоматско препознавање и екстракцију информација, које одговорају предефенисаном критеријуму, са једне или више веб страница, чији је производ скуп уређених парова описа и вредности података. Ако пронађени опис податка постоји у до сада реконструисаној бази података, његова вредност се ажурира на одговарајући начин. У случају да опис податка добијеног екстракцијом не одговара ниједном до сада сачуваном у реконструисаној бази података, он постаје кандидат за додавање у базу.

  • Кључне речи: data mining, information retrieval, pattern mathching, reverse engineering, search engine
  • Датум објављивања: понедељак, 28 децембар 2015