Đây là cuộc tranh luận giữa hai nhà khoa học hàng đầu thế giới trong Thế
kỷ 20, phần thắng nghiêng về Bohr nhưng giới khoa học vẫn chưa hiểu hết
những vấn đề mà Einstein nêu lên. Lập trường của Einstein là : 1.Hạt đã
có sẵn những đặc trưng trước khi đo 2. Tác động ma quái từ xa là không
có thật. Thí nghiệm của Alain Aspect năm 1982 tại Paris, áp dụng bất
đẳng thức của John Bell chứng tỏ là Einstein sai, nhưng giới khoa học
vẫn không hiểu rõ tại sao như vậy.
Theo
thuyết tương đối rộng của Einstein, lực hấp dẫn bắt nguồn từ sự uốn
cong của không gian và thời gian. Khối lượng vật thể càng lớn thì lực
hấp dẫn càng mạnh.
Các nhà khoa học kiểm chứng phần lớn thuyết tương đối rộng trong các trường hấp dẫn yếu chẳng hạn như Trái Đất hay Hệ Mặt Trời.
Trong
các trường hấp dẫn mạnh hơn như siêu lỗ đen (được cho là nằm trong tâm
hầu hết thiên hà lớn), các nhà nghiên cứu nhận thấy sự tham gia của
thuyết tương đối rộng có thể đưa ra lý thuyết mới giúp giải thích những
bí ẩn của vũ trụ như vật chất tối, năng lượng tối.
"Einstein
vẫn đúng, ít nhất là đến lúc này", Andrea Ghez, giáo sư thiên văn học
tại Đại học California Los Angeles và đồng tác giả nghiên cứu, cho biết.
Trong quá trình
nghiên cứu, các nhà thiên văn học chọn lỗ đen siêu lớn tên là
Sagittarius A* (gọi tắt là Sgr A*), nằm tại trung tâm Dải Ngân hà, nặng
hơn Mặt Trời 4 triệu lần với đường kính khoảng 23,6 triệu km.
Sử
dụng Đài thiên văn Keck, Đài thiên văn Gemini và Kính viễn vọng Subaru ở
Hawaii, các nhà thiên văn học đã theo dõi quỹ đạo hoàn chỉnh của S0-2
trong không gian 3 chiều, kết hợp chúng với các phép đo đạc trong 24
năm.
Kết
quả cho thấy quang phổ ánh sáng từ sao S0-2 dịch chuyển sang đỏ khi đi
qua lực hấp dẫn từ lỗ đen Sagittarius A*, phù hợp với thuyết tương đối.
"Những
thí nghiệm này mở ra cánh cửa cho khả năng kiểm tra bản chất lực hấp
dẫn bằng cách tận dụng quỹ đạo các ngôi sao xung quanh những siêu lỗ đen
nằm ở trung tâm Thiên hà. Khả năng này từng được đề cập từ lâu trong lý
thuyết, nhưng cuối cùng chúng ta làm được nó", Tuan Do, nhà vật
lý-thiên văn học Đại học California Los Angeles, chia sẻ.
Nghiên
cứu trên sao S0-2 là nghiên cứu đầu tiên trong nhiều nghiên cứu về
thuyết tương đối dự tính thực hiện trên các ngôi sao gần siêu lỗ đen
Sagittarius A*. Một trong những ngôi sao khác cũng nằm trong kế hoạch
thí nghiệm là S0-102 với quỹ đạo ngắn nhất trong số gần 3.000 ngôi sao
nằm gần lỗ đen siêu lớn, tương đương 11,5 năm.
Những thuật toán trí tuệ nhân tạo mới nhất đang tìm
hiểu sự tiến hóa của các thiên hà, tính toán các hàm sóng lượng tử, tìm
ra những hợp chất hóa học mới, và nhiều thứ nữa. Liệu có công việc nào
của các nhà khoa học không thể được tự động hóa?
Không
một gương mặt nào trong số này là của người thật. Các gương mặt ở hàng
trên (A) và cột bên trái (B) được một mạng sinh đối kháng sinh ra từ các
yếu tố cơ sở lấy từ những ảnh thật. Sau đó, mạng sinh đối kháng kết hợp
những đặc điểm cơ bản của những gương mặt A, gồm giới tính, tuổi, khuôn
mặt, với những đặc điểm tinh hơn của những gương mặt B, như màu tóc và
màu mắt, để tạo ra những gương mặt trong bảng ở giữa.
Không
một người hay một nhóm người nào có thể theo kịp dòng lũ thông tin được
sinh ra từ các thí nghiệm hiện đại về vật lý và vũ trụ. Có những thí
nghiệm ghi lại hàng terabyte dữ liệu mỗi ngày, và luồng dữ liệu sẽ còn
tăng nữa. Kính thiên văn giao thoa vô tuyến Square Kilometer Array, dự
kiến sẽ bắt đầu hoạt động giữa thập kỷ 2020, sẽ sinh ra mỗi năm một
lượng dữ liệu bằng toàn bộ internet.
Dòng
lũ thông tin khiến nhiều nhà khoa học phải quay sang cầu cứu trí tuệ
nhân tạo. Chỉ với sự can thiệp tối thiểu từ con người, những hệ thống
trí tuệ nhân tạo như những mạng thần kinh (là mô hình máy tính mô phỏng
những mạng lưới nơ-ron, bắt chước chức năng của bộ não) có thể cày xới
hàng núi dữ liệu, phát hiện những điểm bất thường và những quy luật mà
con người chẳng bao giờ có thể nhận ra.
Dĩ
nhiên, máy tính đã được dùng trong nghiên cứu khoa học từ cách đây
khoảng 75 năm, và phương pháp thăm dò (một cách “thủ công”) dữ liệu để
tìm ra những quy luật có ý nghĩa thì đã có từ hàng nghìn năm trước.
Nhưng một số nhà khoa học lập luận rằng những kỹ thuật mới nhất của học
máy và trí tuệ nhân tạo là một cách làm khoa học mới mang tính nền tảng.
Một trong những cách tiếp cận đó là tìm mô hình tối ưu dựa trên thống
kê và xác suất (mô hình sinh mẫu – generative model); nó có thể giúp xác
định thuyết hợp lý nhất trong nhiều cách giải thích khác nhau cho dữ
liệu quan sát được, mà chỉ dựa vào dữ liệu, và quan trọng hơn, không cần
tri thức về các quá trình vật lý diễn ra bên trong hệ đang được nghiên
cứu. Phe ủng hộ mô hình này cho rằng nó đủ mới lạ để có thể được coi là
một “cách thứ ba” để tìm hiểu về vũ trụ.
Từ
xưa, chúng ta đã tìm hiểu thiên nhiên thông qua quan sát. Một thí dụ là
việc Johannes Kepler rà soát vị trí các hành tinh từ dữ liệu của Tycho
Brahe và cố tìm ra quy luật ẩn trong đó. (Ông rút ra được rằng các hành
tinh di chuyển trên các quỹ đạo hình ê-líp). Khoa học còn tiến lên nhờ
mô phỏng. Thí dụ, một nhà thiên văn học có thể mô hình hóa chuyển động
của dải Ngân hà và thiên hà Andromeda1 và dự đoán sự va chạm
của chúng trong vài tỷ năm nữa. Quan sát và mô phỏng giúp các nhà khoa
học đưa ra những giả thuyết có thể được kiểm chứng bởi những quan sát
khác mới hơn. Phương pháp tìm mô hình tối ưu dựa trên thống kê và xác
suất khác với cả hai cách tiếp cận này.
“Về
cơ bản, nó là một cách tiếp cận thứ ba, nằm ở giữa quan sát và mô
phỏng,” Kevin Schawinski, nhà vật lý thiên văn tại Viện Công nghệ Liên
bang Thụy Sĩ ở Zurich (ETH Zurich), một trong những người ủng hộ phương
pháp này mạnh mẽ nhất, cho biết. “Nó là một cách khác để tấn công một
bài toán.”
Một
số nhà khoa học coi cách tiếp cận này và những kỹ thuật mới khác đơn
giản là những công cụ mạnh để làm khoa học truyền thống. Nhưng phần lớn
đồng ý rằng trí tuệ nhân tạo đang có ảnh hưởng to lớn, và vai trò của nó
trong khoa học sẽ còn phát triển hơn nữa. Brian Nord, một nhà vật lý
thiên văn tại Phòng thí nghiệm Máy gia tốc Quốc gia Fermi2,
người sử dụng mạng thần kinh để nghiên cứu vũ trụ, là một trong số những
người lo ngại rằng không có một việc gì của một nhà khoa học [con
người] lại không tự động hóa được. “Đó là một ý nghĩ khá đáng sợ,” ông
nói.
Tạo ra để khám phá
Từ
khi còn là nghiên cứu sinh, Schawinski đã nổi tiếng trong lĩnh vực khoa
học dựa trên dữ liệu. Trong luận án tiến sỹ của mình, ông đối mặt với
việc phân loại hàng nghìn thiên hà dựa vào hình dạng của chúng. Vì thời
đó không có sẵn phần mềm nào để làm việc đó, ông quyết định nhờ sự trợ
giúp của cộng đồng, và dự án khoa học Galaxy Zoo ra đời. Bắt đầu từ năm
2007, người dùng máy tính bình thường có thể giúp các nhà thiên văn học
bằng cách cung cấp ý kiến phân loại của mình về các thiên hà, và kết quả
phân loại chọn theo đa số nói chung là chính xác. Đó là một dự án thành
công, nhưng, như Schawinski nhận xét, trí tuệ nhân tạo khiến nó trở nên
lạc hậu: “Ngày nay, một nhà khoa học giỏi, có kinh nghiệm về học máy và
biếtsử dụng điện toán đám mây có thể hoàn thành nó trong một buổi
chiều.”
Schawinski
đến với phương pháp này, một công cụ mới rất mạnh, vào năm 2016. Về cơ
bản, nó cho biết khả năng quan sát được kết quả đầu ra Y nếu điều kiện
đầu vào là X. Cách tiếp cận này đã cho thấy hiệu lực và sự linh hoạt khó
tin. Thí dụ, giả sử chúng ta đưa cho một bộ dữ liệu gồm ảnh một số mặt
người, mỗi bức ảnh kèm theo tuổi của người đó. Trong quá trình duyệt qua
dữ liệu sẵn có này, chương trình máy tính bắt đầu rút ra mối liên hệ
giữa những gương mặt già hơn và khả năng có nếp nhăn lớn hơn. Cuối cùng,
nó có thể làm “lão hóa” một gương mặt bất kỳ, nghĩa là nó có thể dự
đoán những thay đổi mà một gương mặt ở một lứa tuổi bất kỳ có thể trải
qua.
Những hệ mô hình kiểu này được biết đến nhiều nhất là các “mạng sinh đối kháng”3.
Sau khi tiếp xúc với đủ dữ liệu huấn luyện, một mạng sinh đối kháng có
thể phục chế những bức ảnh bị lỗi điểm ảnh, hoặc làm nét những bức ảnh
bị mờ. Chúng học cách suy ra thông tin bị thiếu thông qua một quá trình
cạnh tranh (vì thế mới gọi là “đối kháng”): một phần của mạng, gọi là bộ
phát, tạo ra dữ liệu giả, trong khi phần thứ hai, gọi là bộ tách, tìm
cách phân biệt dữ liệu giả với dữ liệu thật. Chương trình càng chạy thì
cả hai phần càng đồng thời tốt lên. Có lẽ bạn đọc cũng đã từng thấy
những bức ảnh lan truyền rộng rãi gần đây về những gương mặt siêu chân
thực được mạng sinh đối kháng tạo ra; một bài báo đã gọi chúng là những
bức ảnh “về những con người thật một cách dị thường nhưng không tồn
tại”.
Một
cách tổng quát, phương pháp mô tìm mô hình tối ưu này tiếp nhận các bộ
dữ liệu (thường, nhưng không phải luôn luôn, là hình ảnh) và chia nhỏ
chúng thành một tập hợp các khối cơ bản, trừu tượng, mà các nhà khoa học
gọi là “không gian ẩn” của dữ liệu. Thuật toán làm việc với các phần tử
của không gian ẩn để xem chúng ảnh hưởng đến dữ liệu gốc như thế nào,
qua đó khám phá ra những quy luật vận động bên trong hệ.
Khái
niệm không gian ẩn rất trừu tượng và khó hình dung. Một cách đại khái,
có thể so sánh với hoạt động của bộ não khi chúng ta đoán giới tính của
một gương mặt. Chúng ta có thể để ý đến kiểu tóc, hình dáng của cái mũi,
v.v., cũng như những nét khó diễn tả bằng lời. Chương trình máy tính
cũng tìm kiếm những đặc điểm nổi bật từ dữ liệu: dù không biết ria mép
hay giới tính là những thứ gì, nếu được huấn luyện trên những bộ dữ liệu
có những bức ảnh mang nhãn “đàn ông” hoặc “phụ nữ”, và trong đó có
những bức mang nhãn “ria mép”, nó sẽ nhanh chóng suy ra mối liên hệ.
Trong một bài báo công bố tháng 12 năm 20184 trên tạp chí Astronomy & Astrophysics,
Schawinski và các đồng nghiệp tại ETH Zurich là Dennis Turp và Ce Zhang
đã dùng phương pháp mô hình tối ưu để tìm hiểu những thay đổi vật lý
trong quá trình tiến hóa của các thiên hà. (Phần mềm họ dùng xử lý không
gian ẩn theo một cách khác với cách của một mạng sinh đối kháng, bởi
thế nó dù tương tự nhưng không phải là mạng sinh đối kháng.) Mô hình của
họ tạo ra các bộ dữ liệu nhân tạo để kiểm tra những giả thuyết về các
quá trình vật lý. Chẳng hạn, họ muốn biết sự “tắt” của quá trình hình
thành sao (sự giảm đột ngột tốc độ hình thành sao) liên quan như thế nào
đến sự tăng mật độ của một thiên hà.
Với
Schawinski, câu hỏi mấu chốt là có bao nhiêu thông tin về các quá trình
của sao và thiên hà có thể được rút ra chỉ từ dữ liệu. “Hãy xóa hết mọi
thứ chúng ta biết về vật lý thiên văn,” ông nói. “Chỉ dùng dữ liệu, đến
mức độ nào chúng ta có thể khôi phục kiến thức đó?”
Đầu
tiên, những hình ảnh về thiên hà được xử lí đưa về không gian ẩn của
chúng; lúc này, Schawinski có thể điều chỉnh một phần tử của không gian
đó theo một cách tương ứng với một thay đổi nào đó của thiên hà, chẳng
hạn mật độ xung quanh nó. Sau đó, ông có thể tái tạo thiên hà và xem có
khác biệt gì xuất hiện. “Thế là giờ tôi có một cái máy sinh ra giả
thuyết,” ông giải thích. “Tôi có thể lấy một mớ những thiên hà vốn ở
trong môi trường mật độ thấp, và qua quá trình này khiến cho chúng trông
giống như ở trong một môi trường mật độ cao.” Schawinski, Turp và Zhang
nhận thấy rằng khi chuyển từ mật độ thấp sang mật độ cao, các thiên hà
có màu đỏ hơn, và các ngôi sao của chúng tập trung hơn về trung tâm.
Điều này phù hợp với những quan sát đã có, Schawinski cho biết. Câu hỏi
là tại sao lại thế.
Bước
kế tiếp, theo Schawinski, hiện vẫn chưa được tự động hóa: “Tôi phải
bước vào, với vai trò một con người, và nói: ‘Được rồi, hiệu ứng này có
thể được giải thích như thế nào bằng vật lý?’” Có hai cách giải thích có
vẻ hợp lý: Có thể các thiên hà đỏ hơn trong môi trường mật độ cao vì có
nhiều bụi hơn, hoặc có thể chúng đỏ hơn vì sự hình thành sao giảm đi
(nói cách khác, các ngôi sao của chúng già hơn). Cả hai ý tưởng đều có
thể được kiểm tra sử dụng phương pháp tìm mô hình tối ưu theo thống kê:
các thành phần của không gian ẩn liên quan đến độ bụi và tốc độ hình
thành sao được thay đổi để xem chúng ảnh hưởng như thế nào đến màu của
các thiên hà. “Và câu trả lời rất rõ ràng,” Schawinski nói. Những thiên
hà đỏ hơn “khi sự hình thành sao giảm, không phải do thay đổi về bụi.”
Cách
tiếp cận này có liên quan với cách mô phỏng truyền thống, nhưng có
những khác biệt quan trọng. Một mô phỏng “về cơ bản là dựa vào giả
định”, Schawinski nói. “Mô phỏng tức là nói ‘Tôi nghĩ mình biết những
quy luật vật lý nào dẫn đến mọi thứ tôi quan sát được trong hệ.’ Tôi có
một công thức cho sự hình thành sao, một công thức cho cách thức hoạt
động của vật chất tối, v.v. Tôi đưa mọi giả thuyết của mình vào, và chạy
mô hình mô phỏng. Rồi tôi hỏi: Trông nó có giống như thực tế không?”
Trong khi với phương pháp tối ưu thống kê này “theo nghĩa nào đó, đối
lập hoàn toàn với mô phỏng. Chúng ta không biết gì; chúng ta không muốn
giả định gì. Chúng ta muốn dữ liệu tự nó cho biết điều gì có thể đang
diễn ra.”
Kevin Schawinski, nhà vật lý thiên văn và nhà sáng lập công ty trí
tuệ nhân tạo Modulos, lập luận rằng kỹ thuật mô hình sinh mẫu là một
cách thứ ba để tìm hiểu về vũ trụ.
Thành
công rõ ràng của phương pháp này trong nghiên cứu kể trên tất nhiên
không có nghĩa là các nhà thiên văn học và các nghiên cứu sinh đã trở
nên thừa thãi. Nhưng nó dường như cho thấy một sự thay đổi về lượng tri
thức vật lý thiên văn có thể đạt được nhờ một hệ thống nhân tạo mà trong
“tay” không có gì ngoài một kho mênh mông dữ liệu. “Đó chưa phải là
khoa học hoàn toàn tự động hóa, nhưng nó chứng tỏ rằng chúng ta có khả
năng xây dựng những công cụ để tự động hóa chí ít là một phần của quá
trình nghiên cứu khoa học,” Schawinski nói.
Phương
pháp này hiển nhiên rất mạnh, nhưng việc nó có đại diện cho một cách
tiếp cận mới trong khoa học hay không vẫn đang được tranh luận. Với
David Hogg, một nhà vũ trụ học tại Đại học New York và Viện Flatiron, kỹ
thuật này dù rất ấn tượng nhưng rốt cuộc vẫn chỉ là một cách tinh vi để
rút ra các quy luật từ dữ liệu – việc mà các nhà thiên văn học vẫn làm
từ hàng thế kỷ. Nói cách khác, nó là một dạng cao cấp của quan sát và
phân tích. Như Schawinski, Hogg cũng dùng rất nhiều trí tuệ nhân tạo
trong việc nghiên cứu của mình; ông dùng mạng thần kinh để phân loại sao
dựa vào quang phổ và để suy ra các thuộc tính vật lý khác của sao nhờ
các mô hình dựa vào dữ liệu. Nhưng ông coi nghiên cứu của mình, cũng như
nghiên cứu của Schawinski, là khoa học “thử và sai”5. “Tôi
không nghĩ nó là một cách thứ ba,” ông mới phát biểu gần đây. “Tôi chỉ
nghĩ rằng cộng đồng chúng ta đã khéo hơn rất nhiều trong cách sử dụng dữ
liệu. Đặc biệt, chúng ta đã tiến bộ nhiều trong việc so sách các dữ
liệu với nhau. Nhưng theo quan điểm của tôi, việc nghiên cứu của tôi vẫn
nằm trọn trong cách tiếp cận quan sát.”
Những trợ lý cần cù
Dù
có phải là một khái niệm mới hay không, trí tuệ nhân tạo và mạng thần
kinh rõ ràng đã được đưa vào và đóng một vai trò rất quan trọng trong
nghiên cứu thiên văn và vật lý đương đại. Tại Viện Nghiên cứu lý thuyết
Heidelberg6, nhà vật lý Kai Polsterer là trưởng nhóm tin học
thiên văn, một nhóm các nhà nghiên cứu tập trung vào các phương pháp
nghiên cứu vật lý thiên văn mới dựa trên dữ liệu. Gần đây, họ đã sử dụng
một thuật toán học máy để rút ra thông tin về độ dịch chuyển đỏ của các
thiên hà từ dữ liệu, một việc trước đây vốn rất khó khăn.
Polsterer
coi những hệ thống mới dựa trên trí tuệ nhân tạo này là những “trợ lý
cần cù”, những trợ lý có thể lục lọi hàng giờ liền trong đống dữ liệu mà
không nản hay kêu ca về điều kiện làm việc. Những hệ thống này, ông cho
biết, có thể làm hết những công việc nhàm chán, cho phép bạn “tự mình
làm thứ khoa học hay ho, thú vị.”
Nhưng
chúng không hoàn hảo. Đặc biệt, Polsterer cảnh báo, các thuật toán chỉ
biết làm những gì chúng được dạy. Hệ thống không biết gì về dữ liệu đầu
vào. Đưa nó một thiên hà, nó có thể ước lượng tuổi hay độ dịch chuyển đỏ
của thiên hà đó, nhưng đưa nó một bức ảnh “tự sướng” hay ảnh một con cá
chết đang phân hủy, nó vẫn sẽ tính ra một số tuổi (tất nhiên là rất
không chính xác). Cuối cùng, vẫn rất cần sự giám sát của một nhà khoa
học con người, ông nói. “Vẫn lại là bạn, nhà khoa học. Bạn là người có
trách nhiệm giải thích [kết quả].”
Về phần mình, Nord, ở Phòng thí nghiệm Fermi, khuyến cáo rằng mạng thần kinh cần cung cấp không chỉ kết quả, mà cả sai số7 kèm
theo, điều mà mọi sinh viên đều được dạy phải làm. Trong khoa học, nếu
bạn thực hiện một phép đo mà không đưa ra một ước lượng về sai số [của
phép đo đó], sẽ không ai coi các kết quả đó là nghiêm túc, ông nói.
Như
nhiều nhà nghiên cứu trí tuệ nhân tạo khác, Nord cũng lo ngại về sự khó
hiểu của những kết quả do mạng thần kinh đưa ra; thường thì một hệ
thống đưa ra một câu trả lời nhưng không đưa kèm theo một bức tranh rõ
ràng về cách mà câu trả lời đó được tìm ra.
Nhưng
không phải ai cũng cảm thấy sự khó hiểu đó là một vấn đề. Lenka
Zdeborová, một nhà khoa học tại Viện Vật lý lý thuyết thuộc CEA Saclay8
(Pháp), chỉ ra rằng trực giác của con người cũng thường khó hiểu không
kém. Bạn nhìn vào một bức ảnh và nhận ra ngay một con mèo, “nhưng bạn
không biết làm sao bạn biết”, bà nói. “Bộ não của bạn, theo một nghĩa
nào đó, cũng là một hộp đen.”
Không
chỉ có các nhà vật lý thiên văn và các nhà vũ trụ học chuyển hướng sang
khoa học dựa vào dữ liệu và trí tuệ nhân tạo. Những nhà vật lý lượng
tử, như Roger Melko tại viện Perimeter9 và Đại học Warterloo ở
Ontario (Canada), đã dùng mạng thần kinh để giải một số bài toán khó
nhất và quan trọng nhất trong lĩnh vực của mình, chẳng hạn bài toán biểu
diễn hàm sóng mô tả một hệ nhiều hạt. Sự cần thiết của trí tuệ nhân tạo
là do, từ của Melko, “lời nguyền hàm mũ của số chiều”. Cụ thể, số dạng
có thể của một hàm sóng tăng theo hàm mũ của số hạt trong hệ mà nó mô
tả. Độ khó ở đây cũng tương tự như việc tìm ra nước đi tốt nhất trong
một ván cờ vua hoặc cờ vây: bạn cố tính xa hơn nước tiếp theo, tưởng
tượng cách đối thủ đáp trả, rồi lại chọn nước đi tốt nhất, và cứ sau mỗi
một nước, số khả năng lại tăng gấp bội.
Tất nhiên, trí tuệ nhân tạo đã chơi thành thạo cả hai trò: cờ vua từ vài thập kỷ trước10,
còn cờ vây từ năm 2016, khi chương trình AlphaGo đánh bại một kỳ thủ
hàng đầu. Một cách tương tự, chúng cũng thích hợp cho những bài toán vật
lý lượng tử, Melko nói.
Trí tuệ của máy móc
Dù
người đúng là Schawinski, nghĩa là ông đã tìm ra “cách thứ ba” để làm
khoa học, hay là Hogg, nghĩa là nó đơn giản là quan sát truyền thống kết
hợp với phân tích dữ liệu “lên đồng”, rõ ràng trí tuệ nhân tạo đang làm
thay đổi hương vị và giúp tăng tốc khám phá khoa học. Cuộc cách mạng
trí tuệ nhân tạo trong khoa học sẽ tiến xa đến đâu?
Cứ
lâu lâu lại có những tuyên bố to tát về thành tựu của một “nhà khoa học
robot”. Khoảng một chục năm trước, một robot - nhà hóa học có tên Adam
nghiên cứu bộ gene11 của men bánh mỳ và xác định những gene
nào có vai trò tạo ra một số axit amin nào đó. (Adam thực hiện việc này
bằng cách quan sát những đoạn men thiếu một số gene nào đó, và so sánh
với những đoạn men có các gene đó.) Tạp chí Wired đưa tiêu đề “Robot tự mình khám phá khoa học”12.
Mới
hơn, Lee Cronin, một nhà hóa học tại Đại học Glasgow (Scotland), dùng
một robot để trộn ngẫu nhiên các hóa chất với nhau, để tìm những hợp
chất mới. Theo dõi các phản ứng trong thời gian thực với một phổ kế khối
lượng, một máy cộng hưởng từ hạt nhân, và một phổ kế hồng ngoại, hệ
thống dần học được cách dự đoán những phản ứng hóa học nào là mạnh nhất.
Dù nó không tìm ra được chất mới, hệ thống tự động đó, theo Cronin, có
thể giúp đẩy nhanh các nghiên cứu hóa học tới 90 phần trăm.
Năm
ngoái, một nhóm nghiên cứu khác tại ETH Zurich dùng mạng thần kinh để
rút ra các định luật vật lý từ dữ liệu. Hệ thống của họ, một loại
robo-Kepler, thiết lập lại mô hình nhật tâm của hệ Mặt trời từ dữ liệu
vị trí của Mặt trời và sao Hỏa trên bầu trời khi quan sát từ trái Đất,
và rút ra định luật bảo toàn động lượng nhờ quan sát va chạm của những
quả bóng. Vì các định luật vật lý thường có thể được thể hiện theo nhiều
cách, các nhà nghiên cứu tự hỏi liệu hệ thống có thể đưa đến những cách
nghĩ mới, có thể đơn giản hơn, về các định luật đã biết.
Những
thí dụ trên đều nói về việc trí tuệ nhân tạo khởi đầu cho quá trình
khám phá khoa học, mặc dù trong mỗi trường hợp, chúng ta đều có thể
tranh luận về tính cách mạng của cách tiếp cận mới. Có lẽ câu hỏi gây
tranh cãi nhất là có bao nhiêu thông tin có thể được rút ra chỉ từ dữ
liệu. Đây là một câu hỏi cấp thiết trong kỷ nguyên của những dữ liệu vô
cùng lớn (và còn tiếp tục tăng). Trong “Cuốn sách tại sao”13,
nhà khoa học máy tính Judea Pearl và cây viết khoa học Dana Mackenzie
khẳng định rằng dữ liệu “ngu hết sức”. Những câu hỏi về quan hệ nhân -
quả “không bao giờ trả lời được chỉ từ dữ liệu,” họ viết trong sách.
“Bất cứ lúc nào bạn gặp một bài báo hay một nghiên cứu phân tích dữ liệu
mà không theo một mô hình, bạn có thể chắc chắn rằng kết quả của nghiên
cứu đó chỉ là tóm tắt, và có thể biến đổi, nhưng không phải giải thích
dữ liệu.” Schawinski đồng tình với lập trường của Pearl, nhưng ông coi ý
tưởng làm việc “chỉ với dữ liệu” là “hơi đánh tráo khái niệm.” Ông nói
mình chưa bao giờ tuyên bố rút ra quan hệ nhân - quả theo cách đó. “Tôi
chỉ nói rằng với dữ liệu, chúng ta có thể làm được nhiều hơn so với lối
thông thường.”
Một
luận điểm thường gặp khác là khoa học đòi hỏi sáng tạo, và rằng, ít
nhất cho tới hiện tại, chúng ta không biết làm sao lập trình sự sáng
tạo. (Chỉ thử mọi cách, như robot của Cronin, thì chẳng có gì là sáng
tạo cho lắm.) “Tôi cho rằng đưa ra được một lý thuyết có đủ lý lẽ đòi
hỏi sự sáng tạo,” Polsterer nói. “Cứ cần sự sáng tạo là cần phải có con
người.” Và sự sáng tạo đến từ đâu? Polsterer ngờ rằng nó đến từ sự buồn
chán, một điều mà theo ông máy móc không thể nào cảm nhận. “Muốn sáng
tạo, bạn cần ghét cảm giác nhàm chán. Và tôi nghĩ máy tính không bao giờ
có thể thấy chán.” Mặt khác, người ta thường dùng những từ “sáng tạo”,
“truyền cảm hứng” khi nói về những chương trình máy tính như Deep Blue
hay AlphaGo. Và sự khó khăn trong việc diễn tả những gì diễn ra bên
trong “trí tuệ” của máy móc cũng giống như sự khó khăn khi tìm hiểu
chính quá trình suy nghĩ của chúng ta.
Schawinski
mới bỏ môi trường hàn lâm để làm việc trong lĩnh vực tư nhân. Ông hiện
dẫn dắt Modulos, một công ty khởi nghiệp với nhiều nhân viên là các nhà
khoa học của ETH Zurich. Trên trang chủ, công ty tự giới thiệu là “ở
trong mắt bão của sự phát triển trí tuệ nhân tạo và học máy”. Dù có
những trở ngại nào chắn giữa công nghệ trí tuệ nhân tạo hiện nay và trí
tuệ nhân tạo hoàn thiện, Schawinski và những chuyên gia khác vẫn tin
rằng máy móc sẽ làm ngày càng nhiều công việc của các nhà khoa học. Có
giới hạn hay không thì còn chưa biết.
“Liệu
chúng ta có thể, trong một tương lai gần, sử dụng những linh kiện sinh
học, tạo ra một cỗ máy có thể khám phá những tri thức vật lý và toán học
mà những con người thông minh nhất cũng không thể tự mình tìm ra?”
Schawinski băn khoăn. “Liệu tương lai của khoa học có nhất định phải dựa
vào những cỗ máy hoạt động ở một trình độ chúng ta không bao giờ đạt
tới? Tôi không biết. Đó là một câu hỏi hay.”□
Nguyễn Hoàng Thạch dịch
Phạm Tuấn Anh, Trung tâm vũ trụ Việt Nam hiệu đính
Nguồn bài và ảnh: https://www.quantamagazine.org/how-artificial-intelligence-is-changing-science-20190311/
(Tất cả các chú thích là của người dịch)
1 Còn gọi là thiên hà Tiên Nữ, là một thiên hà gần với dải Ngân Hà của chúng ta.
2 “Fermilab”, bang Illinois, Mỹ.
3 Generative adversarial networks (GAN).
4 Tác giả có chút nhầm lẫn: bài báo được nói đến là “Exploring galaxy evolution with generative models”,
đăng trên số tháng 8/2018 (volume 616) của tạp chí A&A; “tháng
12/2018” là ngày ghi trên bản thảo lưu tại trang lưu trữ trực tuyến
ArXiv.
5 “Tried-and-true”.
6 Heidelberg Institute for Theoretical Studies, Đức.
7 Nguyên văn: “error bars”.
8
Institut de Physique Théorique; CEA: Commissariat à l’Energie Atomique
et aux Energies Alternatives – Cơ quan Năng lượng nguyên tử và các Năng
lượng thay thế.
9
Perimeter Institute for Theoretical Physics: viện vật lý lý thuyết ở
Canada, thành lập năm 1999; “perimeter” có thể hiểu là vòng ngoài, bao
quanh.
10 Thực ra là hai thập kỷ.
11 Genome.
12 “Robot makes scientific discovery all by itself”: https://www.wired.com/2009/04/robotscientist/ .
13 The Book of Why (2018).