AI 'khát nước': Huấn luyện ChatGPT đòi hỏi đủ nước để đổ đầy Tháp làm lạnh của Lò phản ứng Hạt nhân

Nghiên cứu mới cho biết, cuộc trao đổi đối thoại của một người dùng bình thường với ChatGPT tương đương với việc đổ một chai nước sạch lớn xuống đất.
AI 'khát nước': Huấn luyện ChatGPT đòi hỏi đủ nước để đổ đầy Tháp làm lạnh của Lò phản ứng Hạt nhân
 
Các mô hình ngôn ngữ lớn (LLM) phổ biến như ChatGPT của OpenAI và Bard của Google rất tốn kém năng lượng, đòi hỏi các trang trại máy chủ to lớn cung cấp đủ dữ liệu để đào tạo các chương trình mạnh mẽ. Việc làm mát chính các trung tâm dữ liệu đó cũng khiến các chatbot AI trở nên vô cùng khát nước. Nghiên cứu mới cho thấy chỉ riêng việc đào tạo cho GPT-3 đã tiêu thụ 185.000 gallon (700.000 lít) nước. Theo nghiên cứu mới, trao đổi trò chuyện của một người dùng bình thường với ChatGPT về cơ bản tương đương với việc đổ một chai nước sạch lớn xuống đất. Với sự phổ biến chưa từng có của chatbot, các nhà nghiên cứu lo ngại tất cả những chai nước bị đổ đó có thể gây ra thiệt hại đáng lo ngại đối với nguồn cung cấp nước, đặc biệt là trong bối cảnh hạn hán lịch sử và sự bất ổn về môi trường đang rình rập ở Hoa Kỳ.

Các nhà nghiên cứu từ Đại học Colorado Riverside và Đại học Texas Arlington đã công bố ước tính mức tiêu thụ nước của AI trong một bài báo in sẵn có tiêu đề “Làm cho AI bớt 'khát' hơn". Các tác giả đã thấy rằng lượng nước sạch cần thiết để huấn luyện GPT-3 là tương đương với lượng nước cần thiết để lấp đầy tháp làm mát của lò phản ứng hạt nhân. OpenAI đã không tiết lộ khoảng thời gian cần thiết để đào tạo GPT-3, điều này làm phức tạp ước tính của các nhà nghiên cứu, nhưng Microsoft, công ty đã đạt được mối quan hệ đối tác trị giá hàng tỷ đô la trong nhiều năm với công ty khởi nghiệp AI (tức là OpenAI) và đã chế tạo các siêu máy tính để đào tạo AI, cho biết rằng siêu máy tính mới nhất của họ, sẽ đòi hỏi một thiết bị làm mát mở rộng, chứa 10.000 card đồ họa và hơn 285.000 lõi bộ xử lý, mang đến cái nhìn thoáng qua về quy mô vận hành rộng lớn đằng sau trí tuệ nhân tạo. Số lượng gallon khổng lồ đó có thể tạo ra các 'cell' pin cho 320 chiếc xe Tesla, hay nói cách khác, ChatGPT, ra đời sau GPT-3, sẽ cần “uống” một chai nước 500 ml để hoàn thành một cuộc trao đổi cơ bản với người dùng bao gồm khoảng 25-50 câu hỏi.

Số gallon khổng lồ cần thiết để đào tạo mô hình AI cũng giả định rằng quá trình đào tạo đang diễn ra tại trung tâm dữ liệu tối tân nhất của Microsoft tại Hoa Kỳ, được xây dựng đặc biệt cho OpenAI với số lượng hàng chục triệu gallon. Nếu dữ liệu được đào tạo trong trung tâm dữ liệu châu Á kém hiệu quả hơn về năng lượng của công ty, thì báo cáo lưu ý rằng mức tiêu thụ nước có thể cao hơn gấp ba lần. Các nhà nghiên cứu kỳ vọng những yêu cầu về nước này sẽ chỉ tổ tăng hơn nữa với các mô hình mới hơn, chẳng hạn như GPT-4 mới được ra mắt gần đây, dựa trên một bộ tham số dữ liệu lớn hơn so với những người tiền nhiệm chúng.


Các nhà nghiên cứu cho biết: “Dấu chân nước của các 'mô hình AI' không còn nằm trong tầm kiểm soát nữa," “Dấu chân nước phải được ưu tiên giải quyết như một phần của nỗ lực tập thể để chống lại những thách thức về nước toàn cầu.”

[​IMG]‘Dấu chân nước’ của trung tâm dữ liệu: mức tiêu thụ nước tại chỗ để làm mát trung tâm dữ liệu và mức tiêu thụ nước bên ngoài để phát điện. Nhiều mô hình AI được đào tạo và/hoặc được triển khai trong trung tâm dữ liệu. Nguồn: ‘Làm cho AI bớt khát hơn’.
Khi tính toán mức tiêu thụ nước của AI, các nhà nghiên cứu đã phân biệt giữa “rút đi” và “tiêu thụ” nước. Ví dụ đầu tiên là thực hiện lấy nước một cách vật lý từ sông, hồ hoặc nguồn khác (rút nước), trong khi mức tiêu thụ đề cập cụ thể đến việc mất nước do bay hơi khi nó được sử dụng trong các trung tâm dữ liệu. Nghiên cứu về việc sử dụng nước của AI tập trung chủ yếu vào phần tiêu thụ của phương trình đó, nơi nước không thể tái chế được.


Bất kỳ ai đã dành vài giây trong phòng máy chủ của công ty đều biết rằng trước tiên bạn cần mặc vào một chiếc áo len. Các phòng máy chủ được giữ mát, thường ở nhiệt độ từ 50 đến 80 độ F (10 đến 26.6 độ C) để tránh thiết bị gặp trục trặc. Duy trì nhiệt độ lý tưởng đó là một thách thức thường trực vì bản thân các máy chủ chuyển đổi năng lượng điện thành nhiệt. Các tháp giải nhiệt như tháp giải nhiệt dưới đây thường được triển khai để cố gắng chống lại sức nóng đó và giữ cho các phòng ở nhiệt độ lý tưởng của chúng bằng cách làm bay hơi nước lạnh.

Sức mạnh điện toán khổng lồ bên trong các trung tâm dữ liệu sản sinh ra nhiệt, khiến cho việc làm mát hiệu quả là một yêu cầu chủ chốt khi xây dựng hệ thống. Các tháp làm mát dựa vào sự bay hơi là một phần tích hợp của nhiều hệ thống tản nhiệt cho trung tâm dữ liệu. Video này minh họa một hệ thống làm lạnh nước, có tích hợp một tháp làm lạnh thương hiệu Marley, các đơn vị làm lạnh, và các bộ điều hòa luồng khí.

Tháp giải nhiệt hoàn thành công việc, nhưng chúng cần một lượng nước khổng lồ để làm như vậy. Các nhà nghiên cứu ước tính khoảng một gallon nước được tiêu thụ cho mỗi kilowatt-giờ tiêu hao trong một trung tâm dữ liệu trung bình. Không phải bất kỳ loại nước nào cũng có thể được sử dụng. Các trung tâm dữ liệu lấy từ các nguồn nước ngọt, sạch để tránh sự ăn mòn hoặc sự phát triển của vi khuẩn có thể đi kèm với nước biển. Nước ngọt cũng rất cần thiết để kiểm soát độ ẩm trong phòng. Các nhà nghiên cứu cũng đề nghị các trung tâm dữ liệu giải thích về lượng nước cần thiết để tạo ra lượng điện lớn mà chúng tiêu thụ, thứ mà các nhà khoa học gọi là “tiêu thụ nước gián tiếp bên ngoài”.

Các vấn đề về tiêu thụ nước không chỉ giới hạn ở các mô hình của OpenAI hoặc AI nói chung. Vào năm 2019, Google đã yêu cầu hơn 2.3 tỷ gallon (khoảng 8.7 triệu mét khối) nước cho các trung tâm dữ liệu chỉ ở ba tiểu bang. Công ty hiện có 14 trung tâm dữ liệu trải rộng khắp Bắc Mỹ mà họ sử dụng để cung cấp sức mạnh cho Google Search, bộ công cụ dành cho nơi làm việc (Google Workspace) và gần đây là các mô hình ngôn ngữ lớn LaMDa và Bard. Chỉ riêng LaMDA, theo báo cáo nghiên cứu gần đây, có thể cần hàng triệu lít nước để đào tạo, lớn hơn GPT-3 vì vài ba trung tâm dữ liệu khát nước của Google được đặt ở các bang nóng bức như Texas; tuy nhiên, các nhà nghiên cứu đã đưa ra cảnh báo với ước tính này, gọi nó là một “điểm tham chiếu gần đúng”.


Google-Data-Center.jpgMột chuyên viên đang làm việc tại trung tâm dữ liệu Google ở Dalles, Oregon. Nguồn: SAP

Bên cạnh nước, các mô hình ngôn ngữ lớn mới cũng yêu cầu một lượng điện đáng kinh ngạc. Một báo cáo về AI của Stanford được công bố vào tuần trước xem xét sự khác biệt về mức tiêu thụ năng lượng giữa bốn mô hình AI nổi bật, ước tính GPT-3 của OpenAI đã giải phóng 502 tấn carbon trong quá trình đào tạo. Nhìn chung, năng lượng cần thiết để đào tạo GPT-3 có thể cung cấp năng lượng cho một ngôi nhà trung bình của người Mỹ trong hàng trăm năm.

Kevin Kent, Giám đốc điều hành của Critical Facilities Efficiency Solution cho biết trong một cuộc phỏng vấn với tạp chí Time: “Cuộc đua của các trung tâm dữ liệu nhằm theo kịp mọi đối thủ là khá điên cuồng. “Không phải lúc nào họ cũng có thể đưa ra những lựa chọn tốt nhất cho môi trường.”

Hiện tại, Diễn đàn Kinh tế Thế giới ước tính khoảng 2.2 triệu cư dân Hoa Kỳ thiếu nước và hệ thống ống nước cơ bản trong nhà. 44 triệu người khác sống với hệ thống nước “thiếu thốn”. Các nhà nghiên cứu lo ngại sự kết hợp của biến đổi khí hậu và việc dân số Hoa Kỳ gia tăng sẽ khiến những con số đó thậm chí còn tồi tệ hơn vào cuối thế kỷ này. Đến năm 2071, Stanford ước tính gần một nửa trong số 204 lưu vực nước ngọt của đất nước sẽ không thể đáp ứng nhu cầu nước hàng tháng. Nhiều khu vực được báo cáo là có thể chứng kiến nguồn cung cấp nước của họ bị cắt giảm một phần ba trong 50 năm tới.

Nhiệt độ tăng cao một phần do hoạt động của con người gây ra đã dẫn đến việc miền Tây nước Mỹ ghi nhận đợt hạn hán tồi tệ nhất trong 1,000 năm qua, mà đồng thời nó cũng đe dọa nguồn nước ngọt, dẫu cho những cơn mưa lũ gần đây đã giúp ngăn chặn một số mối lo ngại nghiêm trọng. Mực nước tại các hồ chứa như Hồ Mead đã rút đi cho đến mức chúng để lộ ra những xác người đã nằm đó hàng thập kỷ.

Screenshot 2023-04-13 173643.jpgSự khác biệt về mực nước ở bến du thuyền tại khu vực Browns Ravine Cove của hồ điều hòa Folsom, gần thủ phủ Sacramento, California, Hoa Kỳ vào ngày 22/5/2021 và ngày 26/3/2022 cho thấy những cơn bão giải nhiệt gần đây đã làm dịu đi đáng kể tình hình hạn hán đã kéo dài 3 năm qua của bang này. Nguồn: ZingNews

Tất cả những điều đó có nghĩa là nhu cầu nước khổng lồ của AI có thể sẽ trở thành một vấn đề ngày càng gây tranh cãi, đặc biệt nếu công nghệ này được đưa vào nhiều lĩnh vực và dịch vụ hơn bao giờ hết. Yêu cầu dữ liệu đối với các LLM ngày càng lớn hơn, điều đó có nghĩa là các công ty sẽ phải tìm cách tăng hiệu quả sử dụng nước cho trung tâm dữ liệu của họ.

Các nhà nghiên cứu cho biết có một số cách tương đối rõ ràng để giảm giá nước của AI. Đối với những công ty mới bắt đầu, vấn đề là ở đâu và khi nào các mô hình AI được đào tạo. Ví dụ, nhiệt độ bên ngoài có thể ảnh hưởng đến lượng nước cần thiết để làm mát trung tâm dữ liệu. Theo giả thuyết, các công ty AI có thể đào tạo các mô hình vào lúc nửa đêm khi trời mát hơn hoặc trong một trung tâm dữ liệu có hiệu quả sử dụng nước tốt hơn để cắt giảm lượng nước sử dụng, họ đúng. Mặt khác, người dùng Chatbot có thể chọn tham gia hội thoại cùng các mô-đun trong “giờ tiết kiệm nước”, giống như các chính quyền đô thị khuyến khích sử dụng máy rửa chén ngoài giờ. Tuy nhiên, bất kỳ thay đổi nào từ bên có nhu cầu đó sẽ đòi hỏi sự minh bạch cao hơn đối với một số công ty công nghệ xây dựng các mô hình này, mà các nhà nghiên cứu cho biết là thiếu tính minh bạch một cách đáng lo ngại.

Các nhà nghiên cứu viết: “Chúng tôi khuyến nghị các nhà phát triển mô hình AI và nhà điều hành trung tâm dữ liệu nên minh bạch hơn. “Các mô hình AI được đào tạo khi nào và ở đâu? Còn các mô hình AI được đào tạo và/hoặc được triển khai trong các trung tâm dữ liệu cho thuê máy chủ của bên thứ ba hoặc các dịch vụ đám mây công cộng thì sao? Những thông tin như vậy sẽ có giá trị lớn đối với cộng đồng nghiên cứu và công chúng nói chung”.
 
(theo Tinh tê)

Đọc báo điện tử Thiếu niên Tiền phong và Nhi đồng nhanh chóng, thuận tiện và an toàn hơn trên các thiết bị di động với Ứng dụng TNTP&NĐ Online

Tải ngay ứng dụng TNTP&NĐ Online TẠI ĐÂY

Bài liên quan

Bài Góc nhìn khác

Miền Bắc tái diễn nồm ẩm kéo dài

Từ nay đến ngày 21/3, miền Bắc vẫn kéo dài tình trạng mưa phùn sương mù. Độ ẩm tăng cao khiến nồm ẩm trở thành nỗi "ác mộng" của thời tiết Bắc Bộ.