Nghiên cứu khoa học

Thông tin về Luận án Tiến sĩ của TS. Vũ Hải Hiệu bảo vệ tại Cộng hòa Pháp

Ngày đăng: 17/03/2016

Sáng ngày 29/01/2016, nghiên cứu sinh (NCS) Vũ Hải Hiệu, Khoa Toán – Tin, Trường Đại học Khoa học - Đai học Thái Nguyên đã bảo vệ thành công Luận án Tiến sĩ ngành Công nghệ thông tin, với đề tài “Indexation aléatoire et similarité inter-phrases appliquées au résumé automatique”

- Tên Luận án:  Indexation aléatoire et similarité inter-phrases appliquées au résumé automatique (Lập chỉ mục ngẫu nhiên và độ tương đồng giữa các câu áp dụng trong tóm tắt tự động)

- Hướng dẫn khoa học:

1. GS.TS. Pierre-François MARTEAU, Đại học Bretagne-Sud (Hướng dẫn chính)

2. TS. Jeannes VILLANEAU, Đại học Bretagne-Sud

3. TS. Farida SAID, Đại học Bretagne-Sud

- Ngày bảo vệ: 29/01/2016

- Địa điểm: Viện nghiên cứu IRISA, Đại học Bretagne-Sud, thành phố Vannes, Cộng hoà Pháp

- Hội đồng chấm Luận án:

STT

Họ và tên

Nơi công tác

Chức danh Hội đồng

1

TS. Sophie ROSSET

Giám đốc viện LIMSI, CNRS

Chủ tịch Hội đồng

Phản biện 1

2

GS.TS. Emmanuel MORIN

Đại học Nantes

Phản biện 2

3

TS. Gwénolé LECORVÉ

Đại học Rennes 1

Ủy viên

4

TS. Jeannes VILLANEAU

Đại học Bretagne-Sud

Hướng dẫn phụ

5

TS. Farida SAID

Đại học Bretagne-Sud

Hướng dẫn phụ

6

GS.TS. Pierre-François MARTEAU

Đại học Bretagne-Sud

Hướng dẫn chính

7

GS.TS. Loannis KANELLOS

Đại học TELECOM Bretagne

Ủy viên

- Tóm tắt mục tiêu và đóng góp của Luận án: Luận án thuộc lĩnh vực xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) với mục tiêu chính là xây dựng một chiến lược biểu diễn giá trị ngữ nghĩa của các loại ngôn ngữ khác nhau (tiếng Anh, Pháp...) làm cơ sở để phát triển một số phương pháp đo độ tương đồng văn bản.

Các đóng góp mới nổi bật của Luận án bao gồm:

1) Xây dựng thành công phương pháp học tự động, không giám sát cho hệ thống biểu diễn ngữ nghĩa (WikiRI) với các ưu điểm: nhẹ, mạnh mẽ, độ bao phủ lớn và thích nghi với nhiều loại ngôn ngữ khác nhau. Phương pháp này giải quyết được hai thách thức lớn trong biểu diễn ngữ nghĩa đó là: độ lớn dữ liệu học (Big Data) và nhiễu trong dữ liệu học (Noisy Data);

2) Đề xuất được hai phương pháp đo độ tương đồng câu dựa trên WikiRI;

3) Phát triển được hệ thống tóm tắt tự động đa văn bản dựa trên kết quả của WikiRI;

4) Phát triển thành công công cụ lọc tự động (online) nguồn dữ liệu học không giám sát;

5) Xây dựng được công cụ (online) hỗ trợ chú thích độ tương đồng câu;

6) Xậy dựng được bốn bộ ngữ liệu tiếng Pháp cho phép đánh giá độ tương đồng câu.

- Kết quả bảo vệ: Xếp loại Xuất sắc

- Tóm tắt nhận xét của Hội đồng:

STT

Thành viên Hội đồng

Nhận xét

Nguyên văn tiếng Pháp

Dịch sang tiếng Việt

1

TS. Sophie ROSSET

Chủ tịch Hội đồng, Phản biện 1

L’ensemble des expériences présentées est impressionnant et relève clairement d’un travail expérimental conséquent. Les résultats sont clairement expliqués et discutés.

Một tập hợp các thực nghiệm được trình bày ấn tượng và nó minh chứng một cách rõ nét rằng giá trị của các kết quả có được là do các thực nghiệm này đem lại. Các kết quả được giải thích và thảo luận một cách rõ ràng.

2

GS.TS. Emmanuel MORIN - Phản biện 2

La démarche scientifique de M. Vu doit être soulignée car il a toujours gardé à l’esprit la volonté de justifier les intuitions sous-jacentes aux choix opérés. En outre, M. Vu a réalisé de très nombreuses expériences sans jamais se (nous) noyer dans celles-ci. C’est un bel exemple de maturité scientifique.

Phương pháp tiếp cận khoa học của ông Vũ (NCS Vũ Hải Hiệu) rất đáng được ghi nhận bởi vì NCS luôn thể hiện mong muốn biện minh và làm sáng rõ các kết quả có được. Hơn nữa, ông Vũ đã thực hiện một số lượng rất lớn các thực nghiệm cho thấy khả năng nghiên cứu tâm huyết, bền bỉ và hiệu quả của NCS. Đây là một ví dụ đẹp của sự trưởng thành trong khoa học.

3

TS. Jeanne VILLANEAU

Durant ses quatre années de thèse, Hai Hieu s'est montré d’un grand sérieux dans le travail et force de proposition dans son activité de recherche. Un bon bagage technique a permis à Hai Hieu de développer efficacement un grand nombre d'outils et de mener à bien des expérimentations variées : traitement de gros corpus (en l'occurrence Wikipédia), développement d'une base de données avec MongoDB, application Web pour faciliter l'annotation de corpus, développement d'un crawler, etc

Trong khoảng thời gian 4 năm làm luận án, Hải Hiệu cho thấy sự nghiêm túc trong công việc và khả năng mạnh mẽ trong đề xuất vấn đề đối với các hoạt động nghiên cứu khoa học. Với hành trang kỹ thuật rất tốt, Hải Hiệu phát triển rất hiệu quả một số lượng lớn các công cụ cũng như tiến hành tốt nhiều thử nghiệm khác nhau như: xử lý một lượng lớn ngữ liệu (Wikipédia), phát triển một CSDL với MongoDB, ứng dụng Web cho việc chú thích ngữ liệu, phát triển trình thu thập tự động, ...)

Hi Hiệu, Minh Thu - Khoa Toán - Tin

           

Thành viên - đối tác

  • hinh anh
  • hinh anh
  • hinh anh
  • hinh anh
  • hinh anh