Information Extraction From E-Commerce Websites Using Sequential Word Group Frequencies
Abstract
In this paper we present an approach how to extract information from e-commerce web sites. Automatic information extraction is applied to e-commerce web sites to construct a description of products. This description contains set of features of the product and their possible values. We implement a new algorithm based on sequential word group frequencies and syntactical rules to extract the semantics. Results are presented and interpreted for future works toward designing an e-commerce shopping agent. Bu çalışmada e-ticaret web sitelerinden bilgi çıkarımının nasıl yapılacağına dair bir yaklaşımı sunuyoruz. Otomatik bilgi çıkarımı, e-ticaret web siteleri üzerinde uygulanarak ürünlerin tanımlanması sağlanır. Bu ürün tanımlaması, ürünün özellikler kümesini ve muhtemel değerlerini içerir. Anlam çıkarımını sağlamak için ardışık kelime grubu frekanslarına ve söz dizimsel kurallara dayanan yeni bir algoritma gerçekleştirilmiştir. Sonuçlar gelecek çalışmalarda bir e-ticaret alışveriş ajanının tasarımı için sunulmuş ve yorumlanmıştır.
Source
Anadolu Üniversitesi Bilim ve Teknoloji Dergisi A - Uygulamalı Bilimler ve MühendislikCollections
- Cilt.09 Sayı.1 [13]