Theo dòng sự kiện

Giải mã tín hiệu lời nói trong não thành văn bản

15/08/2019, 09:58

Thông qua tín hiệu não, câu hỏi mà bệnh nhân đã nghe và câu trả lời họ đưa ra được phần mềm xác định gần như ngay lập tức, với độ chính xác lần lượt là 76% và 61%.


Facebook đang tài trợ việc nghiên cứu giải mã tín hiệu lời nói trong não thành văn bản nhằm cải thiện giao tiếp với bệnh nhân bị liệt. Nghiên cứu ghi lại và chuyển thành văn bản những tín hiệu não được gửi đi để kích hoạt chuyển động của cơ quan môi, lưỡi, hàm và thanh quản.

Stephen Hawking, nhà vũ trụ học mắc bệnh xơ cứng teo cơ một bên (viết tắt là ALS, hay còn gọi là bệnh nơron vận động (MND) hay bệnh Lou Gehrig ALS), mỗi khi muốn giao tiếp đã phải cử động cơ má để điều khiển con trỏ, lựa chọn lần lượt các chữ cái trên màn hình trước mặt để tạo thành các từ.

Quá trình miệt mài mà Hawking đã phải sử dụng có thể sẽ sớm trở nên lỗi thời, thay thế bằng công nghệ hoàn toàn mới: Trích xuất lời nói của một người trực tiếp từ tín hiệu trong não của họ và chuyển thành văn bản.

Đây là lần đầu tiên một nghiên cứu cho thấy ý định nói những từ cụ thể có thể được lượm lặt từ tín hiệu não và biến thành văn bản, quá trình này thậm chí có thể diễn ra với tốc độ đủ nhanh để theo kịp các cuộc trò chuyện tự nhiên.

Ở dạng hiện tại, phần mềm đọc não chỉ hoạt động đối với một kho các câu mà nó đã được đào tạo để đọc, nhưng các nhà khoa học tin rằng đây là bước đệm hướng tới một hệ thống mạnh hơn có thể giải mã theo thời gian thực những lời mà một người dự định nói.

Các bác sĩ tại Đại học California ở San Francisco đã thực hiện thử thách này với hy vọng tạo ra một sản phẩm cho phép những người bị liệt giao tiếp trôi chảy hơn so với việc sử dụng các thiết bị hiện có - nhận chuyển động mắt và co giật cơ để điều khiển bàn phím ảo.

"Cho đến nay, không có hệ thống nói nhân tạo nào cho phép người dùng tương tác ở tốc độ của cuộc trò chuyện tự nhiên giữa con người", Edward Chang, một bác sĩ phẫu thuật thần kinh và là nhà nghiên cứu chính của nghiên cứu được công bố trên tạp chí Nature Communications nói.

Nghiên cứu được thực hiện trên ba bệnh nhân động kinh sắp phẫu thuật thần kinh.

Trước khi các phẫu thuật của họ được tiến hành, cả ba được đặt một miếng điện cực trực tiếp lên não trong ít nhất một tuần để lập bản đồ nguồn gốc các cơn động kinh. Tất cả bệnh nhân đều có thể nói chuyện bình thường và đã đồng ý tham gia vào nghiên cứu của Chang.

Ông đã sử dụng các điện cực để ghi lại hoạt động của não trong khi mỗi bệnh nhân được hỏi 9 câu hỏi và được yêu cầu đọc danh sách 24 câu trả lời tiềm năng.

Với các bản ghi trong tay, Chang và cộng sự đã xây dựng các mô hình máy tính để khớp những mô hình hoạt động não cụ thể với câu hỏi mà bệnh nhân nghe và câu trả lời của họ.

Sau khi được đào tạo, phần mềm có thể xác định gần như ngay lập tức, chỉ bằng tín hiệu não, câu hỏi mà bệnh nhân đã nghe và câu trả lời họ đưa ra, với độ chính xác lần lượt là 76% và 61%.

“Đây là lần đầu tiên phương pháp này được sử dụng để xác định các từ và cụm từ được nói. Chúng tôi đã đạt được điều này bằng cách sử dụng vốn từ rất hạn chế, nhưng trong các nghiên cứu trong tương lai, chúng tôi hy vọng sẽ tăng tính linh hoạt cũng như tính chính xác của những gì chúng tôi có thể dịch", ông David Moses, thành viên nhóm nghiên cứu, cho biết.

Mặc dù thô sơ nhưng hệ thống cho phép bệnh nhân trả lời các câu hỏi về âm nhạc họ thích, họ cảm thấy thế nào, phòng của họ quá nóng hay lạnh, quá sáng hay tối và khi họ muốn được bác sĩ kiểm tra lại.

Tuy đã có những thành công bước đầu nhưng nghiên cứu này vẫn có những thách thức trong việc cải thiện phần mềm để có thể chuyển tín hiệu não thành lời nói đa dạng hơn một cách nhanh chóng.

Điều này sẽ yêu cầu các thuật toán được đào tạo trên một lượng lớn ngôn ngữ nói và dữ liệu tín hiệu não tương ứng, loại dữ liệu có thể thay đổi tùy theo từng bệnh nhân.

Một mục tiêu khác là đọc "lời nói tưởng tượng", hoặc những câu được nói trong tâm trí. Hiện tại, hệ thống phát hiện các tín hiệu não được gửi để di chuyển môi, lưỡi, hàm và thanh quản - nói cách khác, bộ máy của lời nói. Nhưng đối với một số bệnh nhân, những tín hiệu này có thể không đủ, và sẽ cần các cách đọc phức tạp hơn trong não.

Dù không tham gia vào nghiên cứu, nhưng theo Winston Chiong, nhà thần kinh học tại đại học California, San Francisco (University of California, San Francisco – UCSF), điều quan trọng là phải tranh luận về các vấn đề đạo đức mà các hệ thống có thể đặt ra trong tương lai. Chẳng hạn, có thể một những suy nghĩ riêng tư vô tình bị tiết lộ?

Chiong cho rằng, việc giải mã những gì ai đó đang cố nói đã là rất khó và việc trích xuất suy nghĩ bên trong của họ là gần như không thể. Thiết bị của anh chỉ đọc những tín hiệu để thúc đẩy các cơ liên quan đến hoạt động nói.

Cũng theo Chiong, "Tôi không có hứng thú với việc phát triển một công nghệ để tìm hiểu mọi người đang nghĩ gì, ngay cả khi điều đó là có thể. Tuy nhiên, nếu ai đó muốn giao tiếp và đang không thể giao tiếp, tôi nghĩ chúng ta, các nhà khoa học và bác sĩ lâm sàng, có trách nhiệm khôi phục khả năng cơ bản nhất này của con người".

Nguồn: https://www.theguardian.com/science/2019/jul/30/neuroscientists-decode-brain-speech-signals-into-actual-sentences

Bình luận