최근 전 세계적으로 중국산 생성형 인공지능(AI) 서비스인 ‘딥시크’의 접속을 차단하는 움직임이 거세지고 있습니다.
지난해 말 중국 AI 기업이 공개한 딥시크(DeepSeek-V3)가 “저비용으로 기존 AI 모델(LLM)들의 성능을 넘어 섰다”라는 소문의 주인공이 되며 전 세계의 관심을 받았습니다.
‘천문학적인 자금을 투입해야만 경쟁력 있는 LLM을 만들 수 있다’는 기존 AI 기업들의 고정관념을 딥시크가 깨뜨렸다고 생각했기 때문입니다.
딥시크가 공개한 V3 개발 비용은 고작 557만달러(한화로 약 80억 수준)*에 불과했습니다.
* 이후 이는 전체 개발 비용이 아닌 ‘V3 사전 훈련에 사용된 비용’인 것으로 밝혀졌다.
그리고 딥시크를 사용해 본 많은 이용자들도 “저비용으로 개발한 V3가 어떤 면에서는 챗GPT를 포함한 기존 LLM 모델들을 능가한다”라며 환호했습니다.
여론의 반응만 본다면, 챗GPT를 포함한 LLM 시장의 주도권이 금방이라도 서구권에서 중국으로 이동할 것 같았습니다.
그러나 이런 시장의 환호는, 딥시크 출시 이후, 불과 몇 개월 만에 싸늘하게 가라앉게 될 것으로 보입니다.
왜냐하면, 딥시크가 이용자의 개인정보를 무차별적으로 수집한다는 의혹이 붉어졌기 때문입니다.
일부 AI 전문가들은 딥시크가, 챗GPT 등과 달리, 대량의 이용자 정보를 무차별적으로 수집하고 있다고 주장했습니다.
그러면서 특히, 수집 정보 중, 이용자의 ‘키 입력 패턴과 리듬(keystroke patterns or rhythms)’은 매우 이례적인 것이라는 의견도 덧붙였습니다.
그래서 개인정보 보호정책(DeepSeek Privacy Policy)에 따라 딥시크가 수집하고 있는 개인정보를 오픈AI(OpenAI)와 비교해보니 ‘키 입력 패턴 또는 리듬’이라는 명시적 문구 이외에는 별다른 차이가 느껴지지 않았습니다(표 1 참고).
즉 딥시크가 오픈AI보다 더 많은 개인정보를 무차별적으로 수집한다고 주장하려면 추가 근거를 제시해야 할 것으로 보였습니다.
표 1. 오픈AI(챗GPT)와 딥시크가 수집하는 주요 개인정보 비교
구분 | OpenAI(ChatGPT) | DeepSeek |
이용자가 제공하는 개인정보 | 계정 정보(계정 생성 시): 성명, 연락처, 생년월일, 결제 정보 및 거래 내역 등 이용 정보(이용 시): 파일, 이미지, 오디오, 프롬프트 등 소통 정보(커뮤니케이션 시): 이메일 등으로 OpenAI와 커뮤니케이션하는 경우, 성명, 연락처, 메시지 내용 기타 정보: OpenAI의 이벤트 또는 설문조사에 참여한 내용 |
계정 정보: 성명, 생년월일, 이메일 주소 및/또는 전화번호, 비밀번호 이용 정보: 파일, 오디오, 프롬프트, 텍스트, 피드백, 채팅 기록 등 기타 정보: 당사에 연락 시, 이용자 신원 또는 연령, 서비스 사용에 대한 피드백 또는 문의 내용, 기타 정책의 잠재적 위반에 대한 정보 등 |
자동으로 수집되는 정보 | 로그정보(IP 주소, 브라우저 유형 및 설정, 요청 일시 등), 이용 데이터(열람하거나 이용하는 콘텐츠의 종류, 사용 기능, 수행 작업, 시간대, 국가, 접속 일시, 이용자 에이전트 및 버전, 컴퓨터 또는 모바일 기기의 유형, 컴퓨터 연결 등), 기기 정보(사용 기기 명칭, 운영체제, 기기 식별자 및 브라우저 등), 위치 정보, 쿠키 정보 등 |
기술 정보(장치 모델, 운영 체제, 키 입력 패턴 또는 리듬, IP 주소 및 시스템 언어, 충돌 보고서 및 성능 로그를 포함하여 서비스 관련 진단 및 성능 정보 등), 사용 정보, 쿠키 정보, 결제 정보 등 |
기타 수집하는 정보 | 보안 파트너로부터 수집하는 정보(서비스 이용자를 사기 등의 보안 위협으로부터 보호하기 위함), 마케팅 협력업체로부터 수집하는 잠재 고객에 관한 정보, 자사 모델 개발을 위해 수집하는 인터넷에 공개된 정보 등 | 로그인/가입 연계 정보(Google과 같은 타사 서비스를 사용하여 서비스에 로그인하는 경우 경우), 마케팅협력업체로부터 수집하는 광고 관련 정보(타 웹사이트 및 앱 또는 매장에서의 활동, 온라인 또는 직접 구매한 제품/서비스 정보, 해시된 이메일 주소 및 전화번호, 쿠키 등) |
자료: OpenAI Privacy Policy, DeepSeek Privacy Policy
logo: deepseek
몇몇 AI 전문가들은, 챗GPT나 제미나이와 달리, “딥시크에는 옵트아웃(Opt-out) 옵션이 없는 게 문제다”라고 지적하기도 했습니다.
옵트아웃 옵션은 AI 이용자가 스스로 ‘자신의 정보의 수집 및 활용을 거부’할 수 있는 기능입니다.
그러나 일각에선 이런 옵션이 있어도 딥시크가 수집한 개인정보가 안전할 수 없다고 주장합니다.
왜냐하면, 중국 기업이 수집한 개인정보를 중국 정부가 활용할 가능성이 낮지 않기 때문입니다.
그래서 SNS에선 “중국이 만든 AI를 어떻게 믿고 사용하냐”라는 글이 네티즌들의 ‘좋아요’ 세례를 받기도 했습니다.
이미 우리의 개인정보가 중국으로 대량 유출됐던 이력이 적지 않기 때문입니다.
이와 같은 이유 때문인지, 최근 미국을 비롯한 여러 국가들이 딥시크에 대해 매우 적극적으로 방어선을 구축하고 있습니다.
우선 미국 국방부, 항공우주국(NASA) 등에선 딥시크의 사용을 전면 금지했고, 상·하원과 각 주에선 이의 사용을 금지하는 법안들이 계속 발의되고 있다고 합니다.
호주, 캐나다, 네덜란드, 일본, 대만에선 주로 정부와 공공부문에서의 딥시크 사용을 금지했고 이탈리아에선 앱 마켓에서의 딥시크 다운로드를 원천 봉쇄했다고 합니다.
그리고 영국과 유럽연합(EU)에선 아직 직접적으로 딥시크를 규제하진 않았지만 이의 위험성에 대해 예의주시(銳意注視, 단단히 정신을 차리고 주의 깊게 보다)하는 중이라고 합니다.
물론, 우리나라도 이런 움직임에 매우 적극적으로 동참하고 있습니다.
지난 5일부터 외교부, 국방부, 산업통상자원부를 시작으로 여러 정부 부처 등이 딥시크 접속을 차단하고 있으며, 광역지방자치단체, 기업, 대학들도 이런 움직임에 하나 둘 동참하는 모양새입니다.
그러나 이에 대해, 정보 유출과 같은 리스크가 큰 사안에 대해 컨트롤타워 없이 각 정부 부처들이 개별적으로 대응하는 프로세스는 자칫 위험할 수 있다는 의견도 나왔습니다.
이와 같은 민감한 사안에 대해선 일사불란하게 대처할 수 있는 시스템, 컨트롤 타워가 필요하다는 지적입니다.
왜냐하면, 현재와 같이 정보 유출 이슈에 대한 대응을 정부 부처들이 서로 다른 시점에 개별적으로 결정한다면 그 효과가 크게 반감될 가능성이 높기 때문입니다.
이상 시사인사이드 ‘AI 뉴스’였습니다.
English version>>
Two months after DeepSeek was released, the movement to ban its access is growing. We may need an effective control tower…
Recently, there has been a growing movement worldwide to block access to ‘DeepSeek’, a Chinese generative artificial intelligence (AI) service.
Late last year, DeepSeek (DeepSeek-V3), released by a Chinese AI company, garnered attention worldwide as it was rumored to “surpass the performance of existing AI models (LLMs) at a low cost.”
This is because people thought that DeepSeek had broken the stereotype of existing AI companies that ‘anyone has to invest astronomical amounts of money to create a competitive LLM’.
The development cost of V3, as disclosed by DeepSeek, was only $5.57 million (about 8 billion won in Korean currency)*.
* It was later revealed that this was not the total development cost, but the ‘cost used for V3 pre-training.’
And many users who have tried DeepSeek also cheered, saying, “In some ways, the low-cost V3 outperforms existing LLM models, including ChatGPT.”
Judging from the public opinion, it seemed that the leadership of the LLM market, including ChatGPT, would soon shift from the West to China.
However, this market cheer seems to have cooled down in just a few months after the launch of DeepSeek.
This is because suspicions have grown that DeepSeek indiscriminately collects users’ personal information.
Some AI experts have claimed that DeepSeek, unlike ChatGPT, indiscriminately collects a large amount of user information.
They added that among the collected information, the ‘keystroke patterns or rhythms’ of users are very unusual.
Therefore, when this reporter compared the personal information collected by DeepSeek and OpenAI in accordance with each company’s privacy policy, there was no significant difference other than the explicit phrase “keystroke patterns or rhythms” (see Table 1).
In other words, it seemed that someone would have to provide additional evidence to argue that DeepSeek collects more personal information indiscriminately than OpenAI.
Table 1. Comparison of key personal data collected by OpenAI(ChatGPT) and DeepSeek
Cls. | OpenAI(ChatGPT) | DeepSeek |
Info. provided by users | Account Info.: name, contact info., date of birth, payment info. and transaction history, etc. User Content: Files, Images, Audio, Prompts, etc. Communication Info.: When communicating with OpenAI via email or other means, your name, contact information, and message content. Other Info.: Participating in OpenAI events or surveys |
Account Info.: name, date of birth, email, telephone number, password User Info.: files, audio, prompts, feedback, chat history, etc. Other Info.: When you contact us, we collect the information you send us, such as proof of identity or age, feedback or inquiries about your use of the Service, etc. |
Automatically Collected Info. | Log Data(IP address, browser type and settings, date & time of your request, etc.), Usage Data(type of contents, time zone, country, dates and times of access, user agent and version, type of computer or mobile device, computer connections), Device Info.(name of device, operating system, device identifiers, etc.), Location Info., Cookies and Similar Technologies |
Technical Info.(device model, operating system, keystroke patterns or rhythms, IP address, system language, etc.), Usage Info., Cookies Info., Payment Info. |
Info. from other sources | Information collected from security partners (to protect service users from security threats such as fraud), information about potential customers collected from marketing partners, information publicly available on the Internet collected for the development of our own models, etc. | Log-in, Sign-up, or Linked services Info.(Information that occurs when you log in to the Service using a third-party service such as Google), Advertising, Measurement and Other Partners’ Info.(Activity info. on other websites, apps or in stores, information about products/services purchased online or in person, hashed email addresses and phone numbers, cookies, etc.) |
Source: OpenAI Privacy Policy, DeepSeek Privacy Policy
Some AI experts have pointed out that, unlike ChatGPT or Gemini, “the problem with DeepSeek is that there is no opt-out option.”
The opt-out option is a function that allows AI users to ‘refuse the collection and use of their information’.
However, some argue that even with this option, the personal information collected by DeepSeek cannot be safe.
This is because there is a high possibility that the Chinese government will use the personal information collected by Chinese companies.
That is why posts on SNS asking “How can you trust and use AI created by China?” received a lot of ‘likes’ from netizens.
This is because there have already been many cases of our personal information being leaked to China in large quantities.
For this reason, many countries, including the United States, have recently been very active in building defense lines against DeepSeek.
First, the U.S. Department of Defense, NASA, etc. have completely banned the use of DeepSeek, and bills to ban its use are continuously being proposed in the Senate, House of Representatives, and each state.
Australia, Canada, the Netherlands, Japan, and Taiwan have mainly banned the use of DeepSeek in the government and public sectors, and Italy has blocked DeepSeek downloads from app markets.
And although the United Kingdom and the European Union (EU) have not directly regulated DeepSeek yet, they are said to be keeping a close eye on its risks.
Of course, our country is also very actively participating in this movement.
Starting on the 5th, several government ministries, including the Ministry of Foreign Affairs, the Ministry of National Defense, and the Ministry of Trade, Industry and Energy, have been blocking access to DeepSeek, and it seems that local governments, companies, and universities are also joining in one by one.
However, regarding this, there have been opinions that the process of each government ministry responding individually to high-risk issues such as information leaks without a control tower can be dangerous.
It is pointed out that a system and control tower that can respond in an orderly manner to such sensitive issues is necessary.
This is because if government departments decide individually at different times to respond to information leakage issues as they are now, the effect is likely to be greatly halved.
This is “AI News” by Sisainside.