Xây dựng hệ tóm tắt ý kiến về sản phẩm từ nhiều người dùng cho văn bản tiếng việt - Pdf 30

Xây dựng hệ tóm tắt ý kiến về sản phẩm từ
nhiều người dùng cho văn bản tiếng Việt

Trần Thị Hải Yến

Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Hệ thống thông tin; Mã số: 60 48 05
Người hướng dẫn: TS Nguyễn Lê Minh
Năm bảo vệ: 2011

Abstract: Chương 1: “Giới thiệu bài toán tóm tắt văn bản” tóm tắt một số các ứng
dụng của tóm tắt văn bản, phát biểu bài toán tóm tắt ý kiến về sản phẩm từ nhiều
người dùng. Chương 2: “Kiến thức cơ sở” trình bày một số thuật toán, phương pháp sử
dụng trong quá trình tóm tắt. Chương 3: “Sử dụng kỹ thuật tóm tắt đa văn bản cho bài
toán tóm tắt” sẽ đi sâu vào phương pháp tóm tắt cụ thể để giải quyết bài toán chính
của luận văn. Chương 4: “Thử nghiệm và đánh giá” sẽ trình bày quá trình thử nghiệm
của luận văn và các kết quả đạt được trong quá trình thử nghiệm. Đồng thời cũng đưa
ra các phân tích và đánh giá về kết quả đạt được.

Keywords: Xử lý văn bản; Tiếng Việt; Hệ tóm tắt ý kiến; Công nghệ thông tin

Content
Với việc phát triển nhanh chóng của thương mại điện tử, ngày càng có nhiều các sản
phẩm được rao bán trên mạng và cũng ngày càng nhiều người mua sản phẩm trực tuyến. Để
tăng cường sự hài lòng của khách hàng và kinh nghiệm mua sắm, một thực tế phổ biến cho
các nhà kinh doanh trực tuyến là cho phép khách hàng của họ có thể đánh giá hoặc phát biểu
ý kiến về các sản phẩm mà họ đã mua. Với việc ngày càng nhiều người dùng sử dụng mua
bán trực tuyến thì số lượng người đánh giá về sản phẩm ngày càng tăng lên. Kết quả là, số
lượng ý kiến mà một sản phẩm nhận được tăng lên nhanh chóng. Hơn nữa, rất nhiều ý kiến
đánh giá là dài nhưng chỉ có một vài câu có nội dung về đánh giá sản phẩm. Điều này thực sự
khó khăn cho một khách hàng tiềm năng có thể đọc chúng để thực hiện một quyết định đúng

phát tham gia đánh giá bằng văn bản để chia sẻ kinh nghiệm của họ, ý kiến và khuyến nghị
đối với các sản phẩm khác nhau. Một số người tiêu dùng hành động một cách chuyên nghiệp
bằng những phương pháp khác nhau để so sánh các sản phẩm tương tự từ sự khác nhau về
thương hiệu và đưa ra ý kiến ủng hộ hoặc phản đối. Những đánh giá sản phẩm là rất cần thiết
đối với việc thiết kế và sản xuất sản phẩm của nhà sản xuất, nhà sản xuất có thể hiểu rõ hơn
những điều khách hàng quan tâm và cải tiến sản phẩm cho phù hợp. Tuy nhiên, việc xử lý
thông tin quan trọng như vậy không phải là một nhiệm vụ nhỏ. Số lượng đánh giá một cách
trực tiếp của khách hàng có thể phát triển rất nhanh chóng và nó là tốn thời gian để thực sự
đọc qua tất cả chúng bằng “tay”. Làm thế nào để đối phó với các số lượng lớn khách hàng
đánh giá và lựa chọn thông tin hữu ích từ họ đã trở thành một nhiệm vụ quan trọng nhưng đầy
thách thức.
Với thực tế ở trên, luận văn tiến hành nghiên cứu, giải quyết và đề xuất phương pháp
tập hợp mối quan tâm của khách hàng từ việc đánh giá sản phẩm trực tuyến bằng cách sử
dụng tóm tắt văn bản tự động. Cơ sở của đề tài là các kết quả nghiên cứu đã được công bố
trên thế giới về bài toán tóm tắt văn bản tự động. Luận văn cũng tiến hành thử nghiệm tóm tắt
trên một tập các đánh giá về một sản phẩm cụ thể.
Ngoài phần mở đầu và kết luận, kết cấu của luận văn bao gồm 4 chương:
- Chương 1: “Giới thiệu bài toán tóm tắt văn bản” tóm tắt một số các ứng dụng của tóm tắt
văn bản, phát biểu bài toán tóm tắt ý kiến về sản phẩm từ nhiều người dùng.
- Chương 2: “Kiến thức cơ sở” trình bày một số thuật toán, phương pháp sử dụng trong quá
trình tóm tắt.
- Chương 3: “Sử dụng kỹ thuật tóm tắt đa văn bản cho bài toán tóm tắt” sẽ đi sâu vào phương
pháp tóm tắt cụ thể để giải quyết bài toán chính của luận văn.

3
- Chương 4: “Thử nghiệm và đánh giá” sẽ trình bày quá trình thử nghiệm của luận văn và các
kết quả đạt được trong quá trình thử nghiệm. Đồng thời cũng đưa ra các phân tích và đánh giá
về kết quả đạt được.

References

2003 AAAI Spring Symposium on New Directions in Question Answering.
12. Choi, F. Y. Y. (2000). Advances in domain independent linear text segmentation. In
Proceedings of the 1st North American chapter of the association for computational
linguistics (pp. 26–33). Seattle, WA.
13. Dave, K., Lawrence, S., & Pennock, D. M. (2003). Mining the peanut gallery:
Opinion extraction and semantic classification of product reviews. In Proceedings of

4
the 12th international conference on World Wide Web (pp. 519–528). Budapest,
Hungary.
14. Edmundson, H. P. (1969). New methods in automatic extracting Journal of the ACM,
16(2), 264–285.
15. Fayyad, U. M., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to
knowledge discovery: An overview. In U. M. Fayyad, G.
16. Fowler, F. J. (1995). Improving survey questions: Design and evaluation. Sage
Publications, Inc
17. Gamon, M., Aue, A., Corston-Oliver, S., & Ringger, E. (2005). Pulse: “Mining
customer opinions from free text. In Proceedings of advances inintelligent data
analysis VI, 6th international symposium on intelligent data analysis IDA 2005”, (pp
121–132). Madrid, Spain.
18. Ganapathy, S., Ranganathan, C., & Sankaranarayanan, B. (2004). Visualization
strategies and tools for enhancing customer relationship management.
Communications of the ACM, 47(11), 92–99.
19. Gong, Y., & Liu, X. (2001). Generic text summarization using relevance measure and
latent semantic analysis. In Proceedings of the 24th annual international ACM SIGIR
conference on research and development in information retrieval (pp. 19–25). New
Orleans, LA.
20. Gustafsson, A., & Gustafsson, N. (1994). Exceeding customer expectations. In
Proceedings of the sixth symposium on quality function deployment (pp 52–57).
21. Han, J., & Kamber, M. (2001). Data mining: Concepts and techniques. San

31. Mani, I. (2001). Summarization evaluation: An overview NAACL 2001.
32. Mani, I., & Bloedorn, E. (1999). Summarizing similarities and differences among
related documents. Information Retrieval, 1(1–2), 35–67.
33. Mann, W., & Thompson, S. (1988). Rhetorical structure theory: Toward a functional
theory of text organization. Text, 8(3), 243–281.
34. Marcu, D. (1999). Discourse trees are good indicators of importance in text. In I.
Mani & M. Maybury (Eds.), Advances in automatic text summarization (pp. 123–136).
Cambridge, MA: The MIT Press.
35. Piatetsky-Shapiro, P. Smyth, & R. Uthurusamy (Eds.), Advances in knowledge
discovery and data mining (pp 1–34). Menlo Park, CA, USA: American Association
for Artificial Intelligence.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status