Tin tức

NCS Vũ Hải Hiệu bảo vệ luận án Tiến sĩ tại viện nghiên cứu IRISA, Cộng hòa Pháp

Ngày đăng: 17/03/2016

Sáng ngày 29/01/2016, nghiên cứu sinh (NCS) Vũ Hải Hiệu, Khoa Toán – Tin, Trường Đại học Khoa học - Đai học Thái Nguyên đã bảo vệ thành công Luận án Tiến sĩ ngành Công nghệ thông tin, với đề tài “Indexation aléatoire et similarité inter-phrases appliquées au résumé automatique” (Lập chỉ mục ngẫu nhiên và độ tương đồng giữa các câu áp dụng trong tóm tắt tự động), dưới sự hướng dẫn chính của GS.TS. Pierre-François MARTEAU thuộc đại học Bretagne-Sud.

Buổi lễ bảo vệ Luận án diễn ra tại tại viện nghiên cứu IRISA, Đại học Bretagne-Sud, thành phố Vannes, Cộng hòa Pháp. Hội đồng chấm luận án bao gồm 7 Giáo sư, Tiến sĩ đến từ các viện nghiên cứu và trường đại học khác nhau tại Cộng hòa Pháp. Đến dự buổi bảo vệ còn có các thành viên của viện nghiên cứu IRISA, các nhà khoa học và bạn bè, người thân của NCS.

Luận án thuộc lĩnh vực xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP). Mục tiêu chính của Luận án là xây dựng một chiến lược biểu diễn giá trị ngữ nghĩa của các loại ngôn ngữ khác nhau (tiếng Anh, Pháp...) làm cơ sở để phát triển một số phương pháp đo độ tương đồng văn bản. NCS đã đề xuất một hệ thống học tự động dựa trên những nguồn ngữ liệu rất lớn và sẵn có trên Internet (tên viết tắt của hệ thống: WikiRI). Hệ thống này cho phép ứng dụng vào một số tính toán quan trọng trong NLP như: tóm tắt tự động đa văn bản (multi-document summarization), máy tìm kiếm (search engine)... Trong khuôn khổ của Luận án, WikiRI được thử nghiệm trong lĩnh vực tóm tắt tự động đa văn bản, kết quả đạt được là rất khả quan, mở ra triển vọng lớn cho các ứng dụng khác trong lĩnh vực NLP.

Các đóng góp mới nổi bật của Luận án bao gồm:

1) Xây dựng thành công phương pháp học tự động, không giám sát cho hệ thống biểu diễn ngữ nghĩa (WikiRI) với các ưu điểm: nhẹ, mạnh mẽ, độ bao phủ lớn và thích nghi với nhiều loại ngôn ngữ khác nhau. Phương pháp này giải quyết được hai thách thức lớn trong biểu diễn ngữ nghĩa đó là: độ lớn dữ liệu học (Big Data) và nhiễu trong dữ liệu học (Noisy Data);

2) Đề xuất được hai phương pháp đo độ tương đồng câu dựa trên WikiRI;

3) Phát triển được hệ thống tóm tắt tự động đa văn bản dựa trên kết quả của WikiRI;

4) Phát triển thành công công cụ lọc tự động (online) nguồn dữ liệu học không giám sát;

5) Xây dựng được công cụ (online) hỗ trợ chú thích độ tương đồng câu;

6) Xây dựng được bốn bộ ngữ liệu tiếng Pháp cho phép đánh giá độ tương đồng câu.

Những kết quả này được chứng minh rõ nét bằng các mô hình lý thuyết và kết quả thực nghiệm trên các bộ dữ liệu chuẩn đánh giá chung như SemEval, RPM2, DUC.

Sau 45 phút báo cáo và gần 90 phút trả lời các câu hỏi của Hội đồng, NCS Vũ Hải Hiệu đã trao đổi một cách cởi mở và chân thành về những kết quả trình bày trong Luận án với các thành viên Hội đồng cũng như các nhà khoa học tham dự tại buổi lễ bảo vệ. Nhờ vậy công trình đã hoàn toàn thuyết phục được Hội đồng và nhận được các đánh giá rất tích cực. 

Hội đồng đã nhất trí cao trong việc trao học vị Tiến sĩ cho NCS Vũ Hải Hiệu, với kết quả xếp loại xuất sắc.

Sau khi nhận được sự chúc mừng của Hội đồng cũng như toàn bộ các thành viên tham dự, tân Tiến sĩ Vũ Hải Hiệu rất vui mừng, hạnh phúc và không quên cảm ơn các Giáo sư hướng dẫn, các thành viên của Hội đồng, đồng nghiệp, bạn bè và đặc biệt những người thân luôn ủng hộ anh trong suốt quá trình làm nghiên cứu.

Ngoài ra, với kết quả đạt được của hệ thống WikiRI, TS. Vũ Hải Hiệu chính thức được mời làm việc cho dự án ALIENTO tại viên nghiên cứu ATILF - CNRS, Cộng hoà Pháp với vai trò là kỹ sư nghiên cứu và phát triển. Được sự đồng ý của Ban Giám hiệu trường Đại học Khoa học và Ban Chủ nhiệm Khoa Toán - Tin, hiện tại Tiến sĩ đang làm việc tại ATILF - CNRS, đây là cơ hội tốt để phát triển thêm kỹ năng nghiên cứu và ứng dụng cũng như mở rộng quan hệ với các nhà khoa học trong và ngoài nước.

Một số hình ảnh của buổi bảo vệ.

Minh Thu - Khoa Toán - Tin

Thành viên - đối tác

  • hinh anh
  • hinh anh
  • hinh anh
  • hinh anh
  • hinh anh