Trong thời đại phát triển của công nghệ thông tin (CNTT) và trí tuệ nhân tạo (AI), sự bùng nổ của “Đại dịch thông tin sai lệch” đang diễn ra với tốc độ chóng mặt, gây hậu quả vô cùng nghiêm trọng cho chính trị, kinh tế, cũng như an toàn, an ninh thông tin của mọi quốc gia. Công cụ công nghệ hiệu quả, kết hợp với chính sách quản lý của Nhà nước đối với ngành công nghệ thông tin cần được nâng cấp kịp thời, phù hợp với xu thế của tình hình biến động, thay đổi nhanh chóng như hiện nay, hướng tới tương lai phát triển bền vững, an toàn.

  • Mô hình học sâu trong phát hiện tin đồn, tin giả trên mạng xã hội
  • Phòng, chống tin giả trên không gian mạng và cách nhận diện
  • Các mạng xã hội phải báo cáo dữ liệu tin giả hàng tháng

Chiến lược ứng phó với “Đại dịch thông tin sai lệch” cần được phát triển dựa trên những bài học kinh nghiệm quý giá của các nước trên thế giới và tình hình tại Việt Nam. Bên cạnh những chính sách quản lý ngành công nghệ thông tin nói chung, đảm bảo phù hợp với pháp luật, an toàn và trật tự xã hội, dựa trên hai nền tảng trọng yếu là quản lý dữ liệu và quản lý quy trình hướng dẫn máy tính và người dùng [hay còn gọi thuật toán], Nhà nước rất cần xây dựng các chính sách phòng chống, ngăn chặn tin sai, tin độc, cũng như xây dựng những chính sách hỗ trợ xây dựng, phát triển công cụ công nghệ cao nhằm phát hiện và ngăn chặn tin sai, tin độc để bảo vệ an toàn thông tin quốc gia Việt Nam. Đây là nhu cầu vô cùng cấp thiết trong giai đoạn hiện nay.

Những khái niệm cơ bản về Đại dịch thông tin: tin sai, phản tin và tin độc

Để xác định khái niệm “Đại dịch thông tin sai lệch”, cần làm rõ các khái niệm quan trọng liên quan đến các loại tin. Trước hết là khái niệm về dữ liệu và thông tin. Dữ liệu và thông tin là những thuật ngữ thường được sử dụng lẫn lộn, thay thế cho nhau, nhưng bản chất chúng có ý nghĩa riêng biệt.

Dữ liệu đề cập đến các sự kiện hoặc số liệu thô, chưa được tổ chức theo một ý định nhất định, nhằm đúc rút ra một ý nghĩa nào đó. Nó có thể ở dạng số, văn bản, hình ảnh hoặc bất kỳ loại hình đầu vào nào khác. Bản thân dữ liệu thiếu bối cảnh và ý nghĩa. Đây là hình thức biểu diễn cơ bản nhất và cần được xử lý thêm để trở nên hữu ích. Các ví dụ về dữ liệu: tổng dân số của một quốc gia, nhiệt độ thời tiết ghi nhận trên nhiệt kế, giá vàng….

Thông tin là dạng dữ liệu được xử lý và tổ chức. Đó là dữ liệu đã được phân tích, cấu trúc và đưa ra bối cảnh. Thông tin cung cấp ý nghĩa và có thể được sử dụng để trả lời các câu hỏi hoặc đưa ra quyết định. Như vậy, thông tin là kết quả của việc dữ liệu được chuyển sang trạng thái có ý nghĩa và hữu ích hơn.

Một số ví dụ về thông tin bao gồm: Báo cáo về tình hình tăng giá chung cư trong những năm 2023 đến nay cho thấy giá chung cư tăng nhanh chóng một cách bất hợp lý, bài viết nghiên cứu về thực trạng cơ cấu dân số có xu hướng ngày càng chuyển sang ngưỡng dân số già của Nhật Bản, nghiên cứu về tình trạng chênh lệch giàu nghèo ngày càng lớn tại Mỹ….

Chúng ta thường phân loại phân loại thông tin ra làm các loại sau: tin thật, tin sai, tin độc và phản tin. Việc phân loại dựa trên hai yếu tố: Tính xác thực của tin và động cơ tạo ra tin.

Thông tin sai lệch nói chung là thông tin sai có thể xác minh và động cơ có thể là không xác định được. Thông tin sai lệch được phân loại tiếp thành 2 nhóm: Tin sai (misinformation) và phản tin (disinformation). Tin đúng với động cơ xấu nhằm gây hại được gọi là tin độc. Hình 1 dưới đây biểu diễn khái niệm về tin sai, phản tin và tin độc dựa trên hai yếu tố: tính xác thực của tin (tin đúng và tin không đúng) và động cơ tạo ra tin (gây hại hoặc không muốn gây hại).

Hình 1. Biểu diễn khái niệm về tin sai, phản tin và tin độc dựa trên tính xác thực của tin và động cơ tạo ra tin

Các khái niệm chi tiết về tin sai, phản tin và tin độc:

– Tin sai (misinformation): Tin sai có thể vô hại như việc đăng thông tin sai lệch. Đó thường là do lỗi của người dùng, không mang lại lợi ích gì cho ai và tách khỏi mục đích chính trị hay kinh tế lớn hơn. Một ai đó có thể đăng nội dung như sau “1 + 1 = 3” nhằm mục đích giải trí hoặc để ám chỉ một nội dung nào đó khác có nét tương đồng; đó là sai nhưng không có ý định rõ ràng để làm hại bất kỳ cá nhân hoặc nhóm nào.

– Phản tin (disinformation): là loại thông tin sai lệch vừa có chủ ý sai vừa có mục đích gây hại. Nó thường được thúc đẩy bởi mong muốn kiếm tiền, có ảnh hưởng chính trị lớn hơn hoặc gieo rắc hỗn loạn vì mục đích tạo sự hỗn loạn. Ví dụ, theo Báo Điện tử Chính phủ, bài báo “Xử phạt 4 trường hợp thông tin sai sự thật trên mạng xã hội về tình hình mưa lũ” đăng ngày 13/9/2024, công an Bắc Giang đã xử phạt từ 5 đến 7,5 triệu đồng đối với các trường hợp tung tin đồn không đúng sự thật về việc vỡ đê Lục Nam, gây hoang mang cho người dân. Hoặc một ví dụ khác, theo Báo Lao động, ngày 11/12/2024, Phòng An ninh chính trị nội bộ Công an tỉnh Nghệ An đã ra quyết định xử phạt vi phạm hành chính các trường hợp đăng tải thông tin sai sự thật về việc sắp xếp, sáp nhập tỉnh thành lên mạng xã hội Facebook, nhằm mục đích tăng lượng tương tác. Hãy suy nghĩ về khả năng của bạn trong việc xác nhận, bác bỏ hoặc tin tưởng vào thông tin bạn gặp trên internet trước khi tham gia và chắc chắn là trước khi trích dẫn nguồn trong bài nghiên cứu của bạn.

– Tin độc (malinformation): là loại thông tin đúng nhưng việc chia sẻ thông tin đó nhằm mục đích gây hại. Tác hại bắt nguồn từ việc tuyên bố đúng được chia sẻ ngoài ngữ cảnh hoặc tại một thời điểm đặc biệt dễ bị tổn thương đối với mục tiêu nhất định. Sự phát triển của công nghệ thông tin cùng với mạng xã hội khiến cho việc lan truyền thông tin rất nhanh chóng, gây ra những tác hại khó lường. Ví dụ, ngày nay, có rất nhiều người đưa những thông tin của cá nhân khác, khi không được phép lên mạng xã hội, gây tổn hại đến cá nhân, vi phạm quyền về đời sống riêng tư, bí mật cá nhân, bí mật gia đình.

Làn ranh phân loại ba loại tin này biến đổi rất linh hoạt và nhanh trong kỷ nguyên mạng xã hội trực tuyến và AI ngày nay. Phản tin có thể trở thành tin sai nếu tin đó được chứng minh là sai và mọi người vẫn tiếp tục đăng tải không vì mục đích kinh tế hay chính trị nào. Tin độc có thể trở thành phản tin nếu có đủ độ lan truyền trên mạng xã hội, làm thay đổi nội dung câu chuyện ban đầu.

Bảng 1 dưới đây phân loại các loại thông tin, bao gồm cả giả và thật, dựa trên hai yếu tố: Tính xác thực và động cơ được biểu diễn như sau:

Thuật ngữ Định nghĩa Động cơ Tính xác thực
Tin sai nói chung Thông tin sai sự thật có thể xác minh Không xác định Sai
Tin sai Thông tin sai lệch được chia sẻ mà không có ý định đánh lừa hoặc gây tổn hại Không có Sai
Phản tin Thông tin sai lệch được chia sẻ nhằm mục đích gây hiểu lầm Có động cơ gây hiểu lầm Sai
Tin độc Thông tin xác thực được chia sẻ với mục đích gây hại Có động cơ hãm hại Thật

Bảng 1. Phân loại thông tin

“Đại dịch bệnh thông tin giả và độc” trong kỷ nguyên mạng xã hội trực tuyến và bùng nổ AI

Tin giả và phản tin đã trở thành một tai họa lan tràn và tạo ra nhiều thảm kịch đến mức Marcia McNutt, Chủ tịch Viện Hàn lâm Khoa học Quốc gia Hoa Kỳ phải cảnh báo (ngầm đề cập đến đại dịch COVID-19) “Thông tin sai lệch còn tệ hơn cả một dịch bệnh: Nó lây lan với tốc độ ánh sáng trên toàn cầu và có thể gây chết người khi nó củng cố thành kiến cá nhân không đúng chỗ chống lại tất cả các bằng chứng đáng tin cậy” trong một tuyên bố chung của các Viện Hàn lâm Khoa học Quốc gia Hoa Kỳ được đăng vào ngày 15/7/2021.

Mặc dù các mạng xã hội trực tuyến (MXH), hay còn gọi là phương tiện truyền thông xã hội, đã nâng cao khả năng truyền tải thông tin theo thời gian thực, sự phổ biến của MXH đồng thời gia tăng sự lan truyền của tin tức giả bằng cách mở rộng tốc độ và phạm vi phát tán. Tin giả có thể được hiểu là hành vi thao túng thông tin, thông qua việc tạo ra nội dung sai lệch hoặc bóp méo thông tin xác thực. Tuy nhiên, vấn đề này không chỉ giới hạn ở MXH. Trong dân gian truyền miệng, cũng từng lan truyền những những thông tin thiếu cơ sở khoa học như các bài thuốc dân gian chữa bách bệnh không qua kiểm chứng hoặc những câu chuyện hoang đường về hiện tượng siêu nhiên tại các địa phương. Sự phổ biến của mạng xã hội, khiến cho việc phát tán những thông tin này dễ dàng và nhanh chóng hơn.

Mạng xã hội trực tuyến hiện nay đã nổi lên như một kênh lan truyền tin tức giả mạo đầy ảnh hưởng, được ghi nhận trong nhiều nghiên cứu học thuật (Sharma và cộng sự, 2019; Shu và cộng sự, 2017). Theo báo cáo từ Trung tâm Nghiên cứu Pew về xu hướng sử dụng tin tức trên các nền tảng mạng xã hội, vào năm 2020, khoảng 50% người trưởng thành tại Hoa Kỳ cho biết họ ít nhất thỉnh thoảng tiếp cận tin tức thông qua các mạng xã hội, thể hiện sự gia tăng đáng kể so với năm 2018, khi chỉ khoảng 20% trong số họ báo cáo rằng họ thường xuyên dựa vào các nền tảng này để cập nhật tin tức. Sự phổ biến ngày càng tăng của mạng xã hội như một nguồn thông tin đã làm nổi bật vai trò của chúng trong việc định hình nhận thức công chúng, đồng thời đặt ra thách thức trong việc kiểm soát và xác minh tính chính xác của thông tin được chia sẻ.

Năm 2023, nhóm nghiên cứu của Đại học Southern California (Gizem Ceylan và công sự, 2023) đã tìm ra tác nhân có ảnh hưởng lớn nhất đến sự lan truyền của tin giả chính là cấu trúc của các nền tảng xã hội luôn thiên hướng tới thưởng cho người dùng với thói quen hay chia sẻ và phát tán thông tin trên mạng xã hội.

Những phát hiện của nhóm đã thách thức những quan niệm phổ biến hiện nay cho rằng thông tin sai lệch lan truyền vì người dùng thiếu các kỹ năng tư duy phản biện cần thiết để phân biệt sự thật với sự dối trá hoặc vì niềm tin chính trị mạnh mẽ của họ làm sai lệch phán đoán của họ. Do sự khuyến khích phát tán thông tin trên mạng xã hội, tin độc và tin giả đã là có một môi trường phát triển lý tưởng.

Hơn thế nữa, tin giả và tin độc có thể gây ra những tác động sâu rộng đến xã hội, bởi nội dung bị thao túng và sai lệch không chỉ dễ được tạo ra mà còn khó bị phát hiện hơn (Kumar và Shah, 2018). Hơn nữa, những đối tượng phát tán thông tin sai lệch liên tục thay đổi và tinh chỉnh các chiến thuật tạo dựng cũng như lan truyền tin giả, khiến việc đối phó trở nên phức tạp hơn (Kumar và Shah, 2018; Micallef và cộng sự, 2020). Trong một dự báo đáng chú ý trên Tạp chí Công nghệ MIT vào năm 2017, Snow (2017) đã cảnh báo rằng đến năm 2022, phần lớn cá nhân tại các nền kinh tế phát triển có khả năng tiếp xúc với lượng thông tin sai lệch vượt trội so với thông tin xác thực. Hiện tượng này nhấn mạnh sự cần thiết của các biện pháp kiểm soát và nâng cao nhận thức để giảm thiểu ảnh hưởng tiêu cực của tin giả trong bối cảnh thông tin số hóa ngày càng phổ biến.

Các nền tảng truyền thông xã hội đã vượt qua truyền hình, trở thành nguồn cung cấp tin tức chủ đạo đối với giới trẻ tại Anh và Mỹ. Điều này phần lớn xuất phát từ việc tạo dựng và lan truyền tin tức trên môi trường trực tuyến đơn giản và nhanh chóng hơn nhiều so với các phương tiện truyền thông truyền thống như truyền hình, báo in hay đài phát thanh, dẫn đến sự gia tăng đáng kể của tin tức giả được sản xuất trên không gian mạng (Shu và cộng sự, 2017). Hơn nữa, một nghiên cứu được thực hiện trên Twitter đã chỉ ra rằng tin tức giả trực tuyến lan truyền nhanh hơn sáu lần so với thông tin trung thực, đồng thời khoảng 70% người dùng gặp khó khăn trong việc phân biệt giữa tin tức thật và tin giả (Vosoughi và cộng sự, 2018). Nguyên nhân chính được xác định là do sức hấp dẫn của tính mới mẻ mà tin giả mang lại, khiến chúng thu hút sự chú ý và chia sẻ mạnh mẽ hơn (Bovet và Makse, 2019). Những yếu tố này nhấn mạnh vai trò của truyền thông xã hội trong việc khuếch đại tin giả và đặt ra thách thức lớn trong việc kiểm soát chất lượng thông tin trong kỷ nguyên số.

Nghiên cứu đã chỉ ra rằng tin giả lan truyền xa hơn, nhanh hơn, sâu hơn và có phạm vi ảnh hưởng rộng hơn đáng kể so với thông tin trung thực trong mọi danh mục thông tin. Đặc biệt, tác động của tin tức chính trị sai lệch được ghi nhận là vượt trội hơn so với các loại tin giả liên quan đến khủng bố, thiên tai, khoa học hay thông tin tài chính (Vosoughi và cộng sự, 2018). Sự khuếch tán mạnh mẽ của tin giả, đặc biệt trong lĩnh vực chính trị, nhấn mạnh mức độ nghiêm trọng của vấn đề này trong việc định hình nhận thức công chúng và đòi hỏi các biện pháp kiểm soát chặt chẽ hơn để giảm thiểu những tác động tiêu cực trên các nền tảng trực tuyến.

Trong giai đoạn cuối của cuộc bầu cử tổng thống Hoa Kỳ năm 2016, uớc tính có hơn 1 triệu bài đăng trên Twitter liên quan đến tin giả được ghi nhận, phản ánh mức độ nghiêm trọng của vấn đề này trong các sự kiện chính trị quan trọng. Tương tự, vào năm 2017, một phát ngôn viên chính phủ Đức đã nhấn mạnh: “Chúng ta đang đối mặt với một hiện tượng có quy mô chưa từng thấy trước đây,” khi đề cập đến sự bùng nổ và lan truyền mạnh mẽ của tin tức giả trên các nền tảng mạng xã hội. Những ví dụ này cho thấy tin giả không chỉ là một vấn đề cục bộ mà đã trở thành một thách thức toàn cầu, đòi hỏi sự phối hợp chặt chẽ giữa các cơ quan quản lý, nền tảng công nghệ và cộng đồng để kiểm soát và giảm thiểu tác động tiêu cực của nó.

Khái niệm “dịch bệnh thông tin giả” đã được giới thiệu kể từ năm 2020, phản ánh mối quan ngại sâu sắc của các nhà nghiên cứu (Gupta và cộng sự, 2022; Apuke và Omar, 2021; Sharma và cộng sự, 2020; Hartley và Vu, 2020; Micallef và cộng sự, 2020) về sự bùng nổ của thông tin sai lệch liên quan đến đại dịch COVID-19. Thuật ngữ này nhấn mạnh quy mô và tốc độ lan truyền của các nội dung giả mạo, từ các thuyết âm mưu về nguồn gốc virus đến những tuyên bố sai lệch về phương pháp điều trị, gây ảnh hưởng nghiêm trọng đến nhận thức và hành vi của công chúng. Sự gia tăng này không chỉ làm phức tạp các nỗ lực kiểm soát đại dịch mà còn đặt ra thách thức lớn cho các chiến lược truyền thông và quản lý thông tin trong bối cảnh khủng hoảng y tế toàn cầu.

Loại ý định của người đăng tin Loại nội dung Loại bài đăng của người đăng tin Mức DSL Thời gian điều tra
Tốt Thật Thật DSL0 Dài
Hỗn hợp Thật pha lẫn sai lệch DSL1 Ngắn
Sai Sai lệch DSL2 Trung bình
Thật Thật pha ác ý DSL1 Ngắn
Hỗn hợp Hỗn hợp Thật ∩ ác ý ∩  xuyên tạc ∩  sai lệch DSL0 Ngắn
Sai Sai lệch ∩  xuyên tạc DSL1 Ngắn
Thật Ác ý DSL2 Dài
Xấu Hỗn hợp Ác ý ∩  xuyên tạc DSL1 Ngắn
Sai Xuyên tạc DSL0 Trung bình

Bảng 2. Mức độ tín hiệu gian dối (DSL)

Ký tự:

∩ : Giao trong lý thuyết tập hợp

DSL: Deception Signal Level – Mức độ tín hiệu gian dối

Sự bùng nổ của tin giả và độc với sự hỗ trợ của AI và con người

Năm 2022 được ghi nhận trên toàn cầu như một cột mốc quan trọng của AI tạo sinh, đánh dấu bước tiến vượt bậc trong lĩnh vực này. Đây là năm mà các mô hình ngôn ngữ lớn (LLM), chẳng hạn như GPT-3 của OpenAI, cùng với các mô hình chuyển đổi văn bản thành hình ảnh như Stable Diffusion, đã tạo ra một cuộc cách mạng trong khả năng tạo nội dung tự động. Những công nghệ này không chỉ mở ra tiềm năng sáng tạo mà còn làm gia tăng đáng kể khả năng thao túng thông tin trên mạng xã hội, từ việc sản xuất nội dung giả mạo tinh vi đến việc khuếch đại các chiến dịch thông tin sai lệch, đặt ra những thách thức mới cho việc kiểm soát và xác minh thông tin trong không gian số.

Các mô hình ngôn ngữ lớn (LLM), như Bard của Google, LLaMa của Meta và đặc biệt là ChatGPT của OpenAI, đã được tối ưu hóa để tạo ra các cuộc đối thoại với văn bản mang tính tự nhiên, gần giống với khả năng soạn thảo của con người. Những mô hình này có thể sản sinh nội dung mạch lạc, phù hợp ngữ cảnh và có tính thuyết phục cao. Đồng thời, các mô hình chuyển văn bản thành hình ảnh mã nguồn mở, tiêu biểu như Stable Diffusion, cho phép tạo ra các hình ảnh chân thực đến mức đáng kinh ngạc, tái hiện cả những đối tượng có thật lẫn những ý tưởng tưởng tượng. Sự kết hợp của khả năng tạo văn bản và hình ảnh tinh vi này không chỉ mở ra tiềm năng sáng tạo mà còn làm gia tăng nguy cơ sản xuất nội dung giả mạo, đặt ra thách thức lớn cho việc đảm bảo tính xác thực của thông tin trong môi trường số.

ChatGPT và Stable Diffusion đều có thể thực hiện những tính năng tạo văn bản và hình ảnh với quy mô lớn. Tương tự như văn bản, các công cụ AI này có thể tạo ra âm thanh, âm nhạc và video chất lượng cao. Điều này cho thấy các nền tảng truyền thông xã hội hiện nay có thể bị thao túng dễ dàng hơn, tác động đến cả cộng đồng mạng và giới truyền thông mà không đòi hỏi các nguồn lực lớn về nhân sự hay chi phí tài chính như trước đây. Nhờ vào các công nghệ AI tạo sinh, chẳng hạn như các mô hình ngôn ngữ lớn và mô hình chuyển văn bản thành hình ảnh, việc sản xuất nội dung giả mạo tinh vi, từ văn bản đến hình ảnh, đã trở nên nhanh chóng, hiệu quả và ít tốn kém hơn. Kết quả là, khả năng khuếch đại thông tin sai lệch hoặc định hướng dư luận trên mạng xã hội gia tăng đáng kể, đặt ra những thách thức mới trong việc kiểm soát và xác minh thông tin trong không gian số.

Như vậy, việc ứng dụng các công nghệ trí tuệ nhân tạo tạo sinh cho phép các đối tượng có ý đồ chống phá nhà nước hoặc gây rối trật tự xã hội xây dựng cơ sở hạ tầng kỹ thuật số tinh vi để sản xuất nội dung giả mạo với chi phí thấp. Những nội dung này, bao gồm văn bản, hình ảnh hoặc video được tạo ra bởi AI và phát tán trên các nền tảng mạng xã hội như TikTok, Facebook, Instagram, trông có vẻ chân thực nhưng thực chất chỉ là các cấu trúc tổng hợp. Những câu chuyện giả mạo này thường được thiết kế nhằm phục vụ lợi ích của một nhóm cá nhân hoặc tổ chức cụ thể, thao túng dư luận, gây hoang mang hoặc định hướng nhận thức công chúng theo hướng có lợi cho mục tiêu của họ. Điều này đặt ra thách thức lớn đối với các cơ quan quản lý trong việc phát hiện, kiểm soát và ngăn chặn sự lan truyền của thông tin sai lệch trên không gian mạng.

Việc phát triển các thuật toán mô phỏng hành vi con người đã xuất hiện từ những giai đoạn đầu của ngành công nghệ máy tính. Trong bối cảnh mạng xã hội, các bot xã hội độc hại (Malicious Social Bots), tức là những phần mềm được thiết kế chuyên biệt để thao túng các nền tảng mạng xã hội, đã bắt đầu được xây dựng từ thời kỳ sơ khai của mạng xã hội, vào khoảng đầu những năm 2010. Những bot này được lập trình để tự động hóa các hành vi như đăng bài, chia sẻ nội dung hoặc tương tác với người dùng, nhằm khuếch đại thông tin sai lệch, định hướng dư luận hoặc tạo ra các xu hướng giả tạo, từ đó gây ảnh hưởng đến nhận thức và hành vi của cộng đồng mạng. Sự tồn tại lâu dài của các bot này nhấn mạnh thách thức trong việc đảm bảo tính xác thực và an toàn của các tương tác trên không gian số.

Một trong những nghiên cứu nổi bật và được trích dẫn rộng rãi về bot xã hội độc hại gần đây, do nhóm của Giáo sư Emilio Ferrara từ Đại học Nam California phối hợp với Đại học Indiana thực hiện, đã được công bố trên tạp chí khoa học uy tín của Hiệp hội Máy tính (Association for Computing Machinery – ACM), tổ chức hàng đầu thế giới trong lĩnh vực máy tính. Nghiên cứu này cung cấp một cái nhìn toàn diện về sự phát triển và các thay đổi cốt lõi trong thiết kế của các thế hệ bot xã hội độc hại. Cụ thể, nó phân tích cách các bot này được lập trình để mô phỏng hành vi con người tinh vi hơn, từ việc tạo nội dung giả mạo, khuếch đại thông tin sai lệch, đến thao túng dư luận trên các nền tảng mạng xã hội. Nghiên cứu cũng chỉ ra rằng các bot hiện đại tận dụng các kỹ thuật học máy và phân tích mạng để tăng cường khả năng thâm nhập và ảnh hưởng, đồng thời nêu bật những thách thức trong việc phát hiện và ngăn chặn chúng, qua đó nhấn mạnh nhu cầu cấp thiết về các giải pháp công nghệ tiên tiến để bảo vệ tính toàn vẹn của không gian số.

Việc thiết kế nhưng con bot độc hại mạng xã hội này thường được chia ra làm ba thế hệ, từ đơn giản và diện hẹp của thế hệ ban đầu thô sơ, tiếp đến là công nghệ deepfake tạo ra các tác phẩm phức tạp hơn và ngày nay là AI tạo sinh với sự tinh vi, phức tạp và diện rộng.

Thế hệ Công nghệ trọng yếu của mỗi thế hệ Ví dụ
1 Lập trình máy tính cơ bản Các bot bán tự động đăng nội dung do con người tạo ra, không được thiết kế may đo (dễ bị phát hiện)
2 Công nghệ học máy giai đoạn đầu Video bị chỉnh sửa chất lượng thấp; nội dung do máy tính tạo ra có giới hạn nhân rộng; một số phân phối và phổ cập trên mạng bằng các bot
3 AI tạo sinh Văn bản và hình ảnh giả được tùy chỉnh chất lượng cao trên quy mô lớn; tiên tiến, năng động, tự động phân phối và phối hợp.

Thế hệ thao túng mạng xã hội 1.0 được đặc trưng bởi các kỹ thuật sơ khai, sử dụng các bot chất lượng thấp để tạo ra các tài khoản mạng xã hội giả mạo với mức độ tự động hóa cơ bản. Những bot này sản xuất nội dung rõ ràng mang tính tổng hợp và dễ nhận ra là giả mạo, chẳng hạn như các bài đăng văn bản đơn giản, lặp đi lặp lại, thiếu tính tự nhiên. Chúng chủ yếu tập trung vào việc tự động tạo và đăng tải nội dung mà không có khả năng tương tác ý nghĩa với người dùng, dẫn đến việc dễ bị phát hiện bởi cả người dùng và các thuật toán kiểm duyệt. Trong giai đoạn này, phần lớn nội dung giả mạo vẫn được tạo ra trực tiếp bởi con người, với công nghệ chỉ đóng vai trò hỗ trợ hạn chế.

Thế hệ thao túng mạng xã hội 2.0 đánh dấu một bước tiến đáng kể về độ tinh vi. Các bot thuộc thế hệ này được cải tiến với các đặc điểm giống con người hơn, bao gồm: (1) khả năng khai thác dữ liệu từ internet để thu thập thông tin và xây dựng hồ sơ giả mạo trông đáng tin hơn; (2) mô phỏng chu kỳ đăng bài theo nhịp sinh học tự nhiên, chẳng hạn như hoạt động vào ban ngày và nghỉ ngơi vào ban đêm, nhằm tăng tính chân thực; và (3) khả năng tương tác hạn chế với người dùng, chẳng hạn như trả lời bình luận hoặc chia sẻ nội dung theo ngữ cảnh. Nhờ vào sự tiến bộ của trí tuệ nhân tạo, các bot này có thể tạo ra văn bản và tin nhắn mang tính thuyết phục hơn, gần giống với cách giao tiếp của con người.

Cùng với đó, công nghệ deepfake bắt đầu xuất hiện trong thế hệ 2.0, cho phép tạo ra các video giả mạo. Tuy nhiên, những video này vẫn có thể bị phát hiện thông qua quan sát kỹ lưỡng, ví dụ như sự không đồng bộ giữa chuyển động môi và âm thanh, bề mặt da bất thường (quá mịn hoặc quá thô) hoặc tư thế nhân vật thường cố định nhìn thẳng về phía trước. Dù vậy, tính xác thực của các video deepfake được khuếch đại thông qua chiến lược lan truyền trên nhiều tài khoản mạng xã hội, tổng hợp và tái chia sẻ dưới dạng các video hoặc hình ảnh khác nhau, khiến chúng dễ dàng đánh lừa một lượng lớn người xem. Nhìn chung, thế hệ 2.0 đã cải thiện đáng kể tính hợp lý của các tài khoản giả mạo và chất lượng nội dung, khiến việc phát hiện trở nên khó khăn hơn và hiệu quả thao túng mạng xã hội được nâng cao.

Thế hệ thao túng mạng xã hội 3.0, với sự hỗ trợ của AI tạo sinh, đại diện cho một bước nhảy vọt về công nghệ, làm mờ ranh giới giữa nội dung thực và nội dung tổng hợp, đến mức cả con người lẫn máy móc đều khó phân biệt. Điểm nổi bật của thế hệ này không chỉ nằm ở chất lượng nội dung mà còn ở tính chân thực của “người đưa tin” – tức là các tài khoản giả mạo được thiết kế để trông và hành động giống con người hơn bao giờ hết. Các mô hình AI tạo sinh, chẳng hạn như các mô hình ngôn ngữ lớn (LLM), có khả năng tạo ra văn bản, hình ảnh, và trong tương lai gần, có thể là video và âm thanh, với độ chân thực cao, phục vụ cho các chiến dịch thao túng tinh vi.

Khác biệt căn bản của thế hệ 3.0 là sự xuất hiện của các mạng bot quy mô lớn, hoạt động phối hợp như một hệ sinh thái, hỗ trợ lẫn nhau để tăng cường tính tin cậy. Ví dụ, một tài khoản bot có thể chia sẻ nội dung từ một bot khác, tạo ra hiệu ứng lan truyền và củng cố vẻ ngoài đáng tin cậy. Hơn nữa, các mô hình LLM tiên tiến thể hiện khả năng ra quyết định tự chủ vượt trội: khi được giao một nhiệm vụ, chúng có thể lập kế hoạch, thực thi, điều chỉnh hành động dựa trên phản hồi và tự đánh giá khi nhiệm vụ hoàn tất. Sự kết hợp giữa khả năng tự động hóa thông minh và nội dung chất lượng cao khiến thế hệ 3.0 trở thành mối đe dọa đáng kể, không chỉ trong việc lan truyền thông tin sai lệch mà còn trong việc định hình nhận thức công chúng một cách tinh vi và khó phát hiện.

Những đặc điểm chính nổi trội hơn của thế hệ này bao gồm:

Tính xác thực: Công nghệ AI tạo sinh đã cho phép các bot xã hội độc hại hoạt động với mức độ giống con người đáng kinh ngạc, tạo ra các hành vi trông rất chân thực trên mạng xã hội. Chẳng hạn, chúng có thể thu hút sự chú ý của các tài khoản khác bằng cách sử dụng các chiến lược tương tác phù hợp và thuyết phục, chẳng hạn như bình luận theo ngữ cảnh hoặc chia sẻ nội dung cá nhân hóa. Ngoài ra, AI tạo sinh còn có khả năng tạo ra hình ảnh tùy chỉnh, trông cực kỳ thực tế, khiến các tài khoản giả mạo khó bị nghi ngờ trong cái nhìn ban đầu. Mặc dù trong dài hạn, các bot xã hội sử dụng AI tạo sinh có thể bị phát hiện thông qua phân tích kỹ lưỡng, nhưng trong khoảng thời gian ngắn, chúng gần như không thể bị nhận diện, tạo điều kiện cho các chiến dịch thao túng diễn ra hiệu quả trước khi bị ngăn chặn.

Thay thế lao động: Trong thế hệ thao túng mạng xã hội 2.0, có một sự đánh đổi rõ rệt giữa tính xác thực của nội dung và nguồn lực lao động cần thiết. Để tạo ra nội dung càng chân thực và thuyết phục, cần đầu tư nhiều sức lao động của con người hơn, từ việc soạn thảo nội dung đến quản lý tài khoản. Ngược lại, nếu giảm thiểu lao động con người, nội dung sẽ kém chân thực và dễ bị phát hiện. Tuy nhiên, với thế hệ thao túng mạng xã hội 3.0, sự ra đời của AI tạo sinh đã thay đổi hoàn toàn phương trình này. Công nghệ này giảm đáng kể sự phụ thuộc vào lao động con người, cho phép sản xuất nội dung chất lượng cao và quản lý các tài khoản giả mạo một cách tự động. Điều này không chỉ nâng cao tính xác thực mà còn tối ưu hóa hiệu quả của các chiến dịch thao túng mạng xã hội với chi phí nhân lực tối thiểu.

– Mở rộng quy mô với chi phí thấp hơn: Một trong những ưu điểm nổi bật của AI tạo sinh là khả năng mở rộng quy mô dễ dàng mà không làm tăng đáng kể chi phí. Mặc dù việc phát triển và triển khai ban đầu của các hệ thống thao túng mạng xã hội 3.0 có thể đòi hỏi chi phí đầu tư trước, chi phí vận hành không tăng tỷ lệ thuận khi mở rộng quy mô. Điều này nhờ vào khả năng thay thế lao động con người, như đã đề cập, kết hợp với khả năng tự động hóa của các mô hình ngôn ngữ lớn (LLM). Các LLM có thể quản lý đồng thời nhiều bot, tạo nội dung đa dạng và vận hành mạng lưới bot phức tạp ở quy mô lớn, từ việc sản xuất bài đăng đến điều phối các tương tác, mà không cần sự can thiệp liên tục của con người. Điều này làm cho các chiến dịch thao túng trở nên hiệu quả hơn về mặt chi phí và dễ dàng triển khai trên diện rộng.

Khả năng phát hiện thấp hơn: Tính xác thực cao của nội dung do AI tạo sinh sản xuất khiến các bot xã hội độc hại trở nên khó phát hiện hơn nhiều so với các nội dung giả mạo thô sơ của các thế hệ trước. Sự tinh vi của các bot này, từ cách chúng giao tiếp đến cách chúng xây dựng hồ sơ và tương tác, làm giảm khả năng bị nhận diện bởi cả người dùng và các hệ thống kiểm duyệt. Hơn nữa, đang tồn tại một cuộc chạy đua công nghệ giữa việc phát triển các công cụ phát hiện AI tạo sinh và việc cải tiến AI để trở nên khó bị phát hiện hơn. Cuộc đua này càng làm gia tăng thách thức trong việc xác định và ngăn chặn nội dung giả mạo, đặc biệt khi các bot ngày càng trở nên “vô hình” trong dòng chảy thông tin trên mạng xã hội.

Yếu tố con người trong lan truyền tin giả: Ngoài các bot được lập trình để thao túng mạng xã hội, hành vi của người dùng cũng đóng vai trò quan trọng trong việc khuếch đại tin giả. Nhiều người tham gia mạng xã hội thiếu kiên nhẫn hoặc không có thói quen kiểm chứng thông tin, dễ dàng bị cuốn theo tâm lý đám đông và bị thu hút bởi các tin đồn hoặc “tin sốt dẻo”. Những yếu tố này khiến họ trở thành nạn nhân của tin giả và vô tình góp phần lan truyền chúng trên diện rộng. Sự kết hợp giữa công nghệ thao túng tiên tiến và hành vi người dùng thiếu cảnh giác tạo ra một môi trường mà việc phân biệt giữa tin thật và tin giả ngày càng trở nên khó khăn, làm phức tạp thêm nỗ lực kiểm soát thông tin sai lệch trên các nền tảng mạng xã hội.

Một nghiên cứu gần đây do ba chuyên gia đến từ trường Đại học Công nghệ Massachusetts (MIT) danh tiếng thực hiện đã chỉ ra một thực tế đáng lo ngại: các thông tin giả mạo có xu hướng lan truyền trên mạng xã hội Twitter nhanh hơn đáng kể so với các tin tức xác thực – và điều này xảy ra với một khoảng cách rất lớn về tốc độ lẫn phạm vi lan tỏa.

Giáo sư Sinan Aral, hiện đang giảng dạy tại Trường Quản lý Sloan thuộc MIT, cho biết: “Chúng tôi phát hiện rằng tin giả không chỉ lan truyền nhanh hơn, mà còn đi xa hơn, thâm nhập sâu hơn vào mạng lưới người dùng và lan rộng hơn về quy mô so với tin thật, bất kể đó là loại thông tin nào và trong nhiều trường hợp, sự khác biệt này là vô cùng đáng kể.”

Ngoài ra, nhóm nghiên cứu tại MIT cũng nhấn mạnh rằng hiện tượng lan truyền nhanh chóng của tin giả không thể hoàn toàn đổ lỗi cho các tài khoản bot, tức là các chương trình tự động được lập trình để chia sẻ các thông tin sai lệch. Thay vào đó, phần lớn sự lan tỏa của tin tức sai lệch lại bắt nguồn từ chính hành vi của người dùng mạng xã hội, những người thường vô tình hoặc thiếu suy xét mà chia sẻ và lan truyền các câu chuyện không đúng sự thật.

Theo kết quả nghiên cứu, khả năng một thông tin giả được chia sẻ hoặc đăng lại trên Twitter cao hơn tới 70% so với một tin có thật. Không chỉ vậy, một câu chuyện thật cần gấp sáu lần thời gian mới có thể tiếp cận được 1.500 người dùng đầu tiên so với một tin giả vốn có thể tiếp cận lượng người tương đương trong thời gian ngắn hơn nhiều. Khi xét đến chiều sâu của các chuỗi lan truyền liên tục trên mạng xã hội như Twitter, tin giả đạt đến lớp người dùng thứ 10 nhanh hơn gấp 20 lần so với các câu chuyện có thật. Đáng chú ý hơn, các tin tức bịa đặt cũng được người dùng chia sẻ lại với phạm vi rộng hơn rất nhiều ở tất cả các tầng phát tán của mạng lưới.

Từ đó có thể thấy rằng, dù là do các bot độc hại được lập trình để thao túng thông tin trên mạng xã hội, hay do chính những người dùng thật dễ bị ảnh hưởng bởi hiệu ứng đám đông và thiếu kiểm chứng thông tin, thì tin giả vẫn có xu hướng lan tỏa nhanh hơn, sâu hơn và rộng hơn rất nhiều so với tin thật trên các nền tảng truyền thông xã hội.

Một nghiên cứu mới của nhóm tại Đại học Zurich, Thụy Sỹ, cho thấy thông tin sai lệch do AI tạo ra có thể thuyết phục hơn cả thông tin sai do con người viết. Cụ thể, mọi người có khả năng phát hiện các tweet sai do AI tạo ra thấp hơn 3% so với tweet sai do con người viết. Giovanni Spitale, trưởng nhóm nghiên cứu, xuất hiện trên tạp chí Science Advances, cảnh báo rằng dù mức chênh lệch này nhỏ, nhưng đáng lo vì thông tin sai lệch do AI tạo ra đang có xu hướng gia tăng mạnh. Ông cho biết: “Thực tế là thông tin sai lệch do AI tạo ra không chỉ rẻ hơn, nhanh hơn mà còn hiệu quả hơn, khiến tôi gặp ác mộng.” Spitale tin rằng nếu dùng mô hình mới hơn như GPT-4 của OpenAI, khoảng cách này sẽ còn tăng lên.

Từ lâu, Tập đoàn Gartner đã dự đoán nhu cầu cấp thiết phát triển các thuật toán AI nhằm đối phó thực tế giả mạo và tin tức sai lệch (2018). Tuy nhiên, (Snow 2017) đặt nghi vấn về khả năng AI chiến thắng trong cuộc chiến chống tin giả, và nhiều nhà nghiên cứu cũng đồng tình rằng ngay cả AI tiên tiến nhất cũng chưa đủ hiệu quả để phát hiện tin giả. Paschen (2019) chỉ ra rằng khả năng tạo ra tin giả của AI vượt trội so với khả năng phát hiện nó. Việc nhận diện tin giả vẫn là một thách thức lớn vì nội dung thường được tạo ra để giống với sự thật và đánh lừa người đọc. Do đó, việc tìm kiếm các biện pháp hiệu quả hơn là điều cấp thiết để kiểm soát tin giả trên mạng xã hội.

Các đề xuất giải pháp đối với Việt Nam trong kỷ nguyên Dịch bệnh thông tin giả và độc

Đối với những giải pháp cụ thể của Việt Nam cần thực hiện trong giai đoạn hiện nay nhằm ứng phó Đại dịch thông tin sai và độc, nhóm tác giả xin đề xuất như sau, dựa trên các bài học kinh nghiệm quý giá của nhiều nước:

Cần hoàn thiện chính sách an toàn thông tin cho toàn bộ chủ quyền không gian mạng của Việt Nam dựa trên hai nền tảng chính là quản lý dữ liệu quốc gia của tất cả các tổ chức và cá nhân trên lãnh thổ Việt nam và xây dựng, hoàn thiện chính sách quản lý thuật toán đối với tất cả các công ty công nghệ cung cấp dịch vụ cho toàn xã hội.

Cần xây dựng và hoàn thiện các chính sách phòng chống và ngăn chặn tin sai và tin độc trên các nền tảng MXH trực tuyến cũng như trên các nền tảng AI tạo sinh.

Cần xây dựng các chính sách và thứ tự ưu tiên của Nhà nước trong việc xây dựng công cụ công nghệ cao nhằm phát hiện và ngăn chặn tin sai và tin độc.

Cần xây dựng lộ trình và thứ tự ưu tiên cụ thể để xây dựng và phát triển các công cụ công nghệ cao, nhằm phát hiện và ngăn chặn ảnh giả dưới dạng văn bản, tiến tới tin giả từ các video không chứa âm thanh, âm thanh giả, video giả với âm thanh đầy đủ.

Song song, chúng ta rất cần phát triển các công cụ công nghệ cao phát hiện và ngăn chặn các văn bản phát tán tin giả và tin độc, một trụ cột quan trọng trong cuộc chiến chống lại Đại dịch thông tin sai lệch.

Cuộc chiến chống lại Đại dịch thông tin sai và độc là một cuộc kháng chiến trường kỳ và liên tục. Trước những hậu quả rất nghiêm trọng của đại dịch tin giả, độc đối với an toàn thông tin nói riêng và an ninh quốc gia nói chung của Việt Nam, sự quan tâm của Đảng và Nhà nước là vô cùng trọng yếu; quyết tâm chính trị huy động các lực lượng xã hội là yếu tố tiên quyết quyết định sự toàn thắng của chúng ta trước đại dịch này.

TÀI LIỆU THAM KHẢO

[1]. https://today.usc.edu/usc-study-reveals-the-key-reason-why-fake-news-spreads-on-social-media/

[2]. https://www.pnas.org/doi/10.1073/pnas.2216614120

[3]. https://www.technologyreview.com/2023/06/28/1075683/humans-may-be-more-likely-to-believe-disinformation-generated-by-ai/

[4].https://www.nationalacademies.org/news/2021/07/as-surgeon-general-urges-whole-of-society-effort-to-fight-health-misinformation-the-work-of-the-national-academies-helps-foster-an-evidence-based-information-environment,

[5]. https://www.pewresearch.org/fact-tank/2018/12/10/social-media-outpaces-print-newspapers-in-the-u-s-as-a-news-source/

[6]. https://www.buzzfeednews.com/article/janelytvynenko/coronavirus-fake-news-disinformation-rumors-hoaxes

[7]. https://www.factcheck.org/2020/03/viral-social-media-posts-offer-false-coronavirus-tips/

[8]. https://www.technologyreview.com/s/612236/even-the-best-ai-for-spotting-fake-news-is-still-terrible/,

[9]. https://ec.europa.eu/digital-single-market/en/tackling-online-disinformation,

[10]. https://about.instagram.com/blog/announcements/combatting-misinformation-on-instagram,

[11]. https://dl.acm.org/doi/10.1145/2818717

[12]. https://news.mit.edu/2018/study-twitter-false-news-travels-faster-true-stories-0308

 

Tác Giả :  Vũ Đức Thi , Lê Quang Minh (Viện Công nghệ Thông tin – Đại học Quốc gia Hà Nội) , Vũ Đức Nghĩa (Trường Đại học Kinh tế – Đại học Quốc gia Hà Nội)

Đăng ngày:09/05/2025

Link Nguồn: https://antoanthongtin.vn/tin/dai-dich-tin-sai-va-tin-doc-trong-ky-nguyen-ai-thach-thuc-va-nhung-giai-phap-de-xuat-voi-viet-nam-tac-gia-dang-chinh-sua

Bệnh viện Hạnh Phúc