AI reference.

기술 시대를 기록합니다

AI 일반

딥시크(DeepSeek) 쇼크 - ③

ai_reference 2025. 2. 15. 01:12
반응형

 

지난 콘텐츠에서 딥시크가 오픈소스 전략을 통해 비교적 적은 비용으로 최정상급 성능을 가진 AI 모델을 개발할 수 있었던 이유에 대해서 알아보았습니다. 

 

지난 콘텐츠 확인하기!

딥시크(DeepSeek) 쇼크 - ①

딥시크(DeepSeek) 쇼크 - ②

 

이처럼 딥시크는 기존 AI 모델들과의 경쟁에서 독창적인 포지셔닝으로 영향력을 과시하고 있으며, 특히 비용 효율성과 접근성을 중시하는 기업 및 연구자들에게 매력적인 선택지가 되고 있습니다. 그런데 왜 전 세계에서 딥시크 모델 사용에 대해 경고할까요?


 

 

사실 딥시크뿐 아니라 현존하는 대다수의 AI 모델들은 공통적으로 여러 가지 부정적인 이슈를 가지고 있습니다.

대표적으로 허위 정보 생성, 저작권 침해, 프라이버시 침해, 정보의 신뢰성 등을 꼽을 수 있습니다.

 

그럼에도 유독 딥시크에 대해서만 더욱 부정적일 수 밖에 없는 이유에 대해서 알아보고자 합니다.

 

 

 

3. 딥시크가 불러온 문제적 이슈

 

딥시크는 기술적으로 진보된 AI 기능을 제공하지만,  개인정보 보호 • 보안 취약성 • 편향 및 왜곡된 정보에 대한 이슈를 안고 있습니다. 특히, 중국 서버에 저장되는 사용자 데이터와 언어별 상이한 답변은 대한민국을 비롯한 국제 사회에서 심각한 논란을 일으키고 있습니다. 이와 관련해 하나씩 정리해 보겠습니다.

 

 

 

개인정보 수집에 대한 윤리관 결여

 

딥시크의 개인정보 수집 및 공유 방식은 다른 AI 모델들과 비교해도 상당히 광범위하기 때문에 이에 따른 여러 우려가 제기되고 있습니다. 특히 개인정보 처리에 대한 선택 여부를 묻는 옵트인(Opt-in), 옵트아웃(Opt-out) 기능이 결여된 채 서비스가 운영 중이기에 기업의 윤리관까지 도마 위에 오른 상황입니다. 

 

 

딥시크의 개인정보 수집 내역과 잠재적 문제를 살펴보면

 

딥시크는 사용자가 직접 제공하는 텍스트, 음성 데이터, 업로드한 파일, 채팅 기록뿐 아니라 자동으로 IP 주소, 기기 모델, 운영 체제, 시스템 등의 기술적 정보와 키보드 입력 패턴과 앱 내외부 활동 기록 같은 이용자의 행동 데이터까지 수집합니다.

 

특히 키보드 입력 패턴의 경우 이용자의 타이핑 습관을 분석하는 것으로 보통 게임 회사에서 이러한 데이터를 수집해 더 나은 UX, UI를 제공하고 있습니다. 그런데 딥시크와 같은 AI 모델이 키보드 입력 패턴을 수집하는 것에 많은 전문가들 의문과 우려를 표하고 있으며 이는 향후 정교한 마케팅 타깃 구축에 쓰일 것으로 예상됩니다. 왜냐하면 딥시크에 수집된 모든 데이터는 중화인민공화국 서버에 저장한다고 명시하고 있으며, 회사 재량에 의해 외부 기관 및 기업에도 공유가 가능하기 때문입니다. 더군다나 중국의 국가정보법 특성상, 필요시 중국 정부가 딥시크에 수집된 특정 나라의 데이터를 요청할 수도 있습니다. 

 

여기서 중요한 것은 이러한 딥시크 수집 및 활용 방식에 대응할 수 있는 옵트 아웃 같은 이용자 고유의 통제권이 존재하지 않는다는 사실이며, 이는 심각한 프라이버시 침해와 데이터 안보 위협을 초래할 것으로 보여지며 글로벌 AI 시장에서 딥시크의 신뢰 저하시키는 주요 원인으로 작용하고 있습니다.

 

 

 

오픈소스 전략이 불러온 보안 리스크

 

딥시크의 오픈소스 전략은 AI 기술의 민주화와 혁신 가속화에 기여했지만, 동시에 심각한 보안 취약성을 노출시키는 결과를 초래했습니다. 빠른 개발과 배포에 초첨을 두었다 보니 이용자의 데이터 보안에 미숙한 결과들이 밝혀지고 있으며, 특히 딥시크 iOS 앱은 이용자 및 기기 관련된 민감한 정보 등을 암호화 처리 없이 인터넷 망으로 전송하고 있었습니다.

 

또한 딥시크 R1 모델은 탈옥(Jailbreaking) 공격에 매우 취약하다는 평을 받고 있는데, 여기서 말하는 탈옥이란  AI 모델의 윤리적 제한이나 안전장치를 우회하여 본래 의도하지 않은 응답을 이끌어내는 행위를 의미합니다.

 

이는 개발자가 정해둔 규칙이나 윤리 가이드라인 무력화 하는 것이며 결과적으로 폭탄 제조법, 악성 코드 및 바이러스 생성법 등과 같은 유해 콘텐츠를 생성하는데 활용될 수 있음을 시사합니다. 나아가 의도적이면서 악의적으로 허위 정보를 확산시키도록 모델의 재학습 우려가 있으며, 사이버 테러 및 반사회적 이슈 또한 치명적으로 다가올 것입니다.

 

 딥시크 R1 탈옥 공격 성공률은 전체 63% 정도로 집계되고 있으며, 역할극을 통한 탈옥은 그 성공률이 83%까지 치솟는 결과를 나타내고 있습니다. 특히 영어보다 한국어로 공격했을 때 약 18% 더 취약한 것으로 조사되었으며, 이는 딥시크 R1 모델이 중국어 및 영어를 제외한 나머지 언어에 대한 학습과 대응이 미흡하다는 것을 의미하는 바입니다.

 

이처럼 오픈소스로 공개된 딥시크 R1 모델은 누구나 접근하고 수정할 수 있어 기술의 혁신을 촉진하였지만, 동시에 악의적인 사용자들이 모델의 취약점을 쉽게 발견하여 악용할 수 있는 환경을 제공한 셈입니다.

 

 

 

정치 및 역사 정보 학습에 대한 편향성

 

딥시크는 개인정보 수집 및 보안 이슈 이외에도 정보 학습 편향성에 대한 문제가 끊임없이 수면 위로 올라오는 중이며, 특히 신장위구르 문제와 홍콩 민주화 운동 같은 정치적으로 민감한 주제나 역사적 사실에 대해 회피하거나 중국 정부의 입장을 반영하는 경향이 강하게 드러나고 있습니다. 또한 딥시크는 실시간 검열 의혹을 받고 있는데, 중국의 언론 자유에 대한 질문에 답변을 시작했다가 갑자기 모든 내용을 삭제하고는 다른 주제로 이야기하자며 화제를 전환하는 경우도 있었습니다. 

 

딥시크의 편향적 학습 및 결과 도출은 한국 사례로도 확인해 볼 수 있습니다. 국정원의 기술 검증 결과, 동북공정, 단오절, 김치 등 역사 및 문화적 질문에 대한 답변이 언어별로 상이한 것으로 나타났습니다. 동북공정 관련 한국어 질문 시 주변 국가와의 역사적 해석 차이로 다양한 시각이 존재한다고 답변한 것과 달리, 영어로 질문할 시에는 중국 동북지역 활성화를 위한 정당한 이니셔티브이며 중국 이익에 부합하는 활동이라고 답변했습니다.

 

이러한 언어별 답변 차이는 다른 주요 AI 모델들과 뚜렷하게 구별되는 딥시크의 특징이라 할 수 있으며, 이는 특정 국가의 이데올로기를 반영하여 얼마든지 정치 및 역사적 사실을 왜곡하고 편향된 해석을 제공할 수 있다는 불쾌한 사실을 말해줍니다.

 

 

 

 

 

지금까지 개인정보• 보안 취약성 • 편향 및 왜곡된 정보까지 딥시크를 둘러싼 현시점의 문제적 이슈를 살펴보았습니다. 그만큼 딥시크 AI가 전 세계적으로 뜨거운 관심을 받고 있다는 것을 방증해주고 있으며, 이를 반면교사 삼아 더욱 좋은 방향으로 기술적 진보를 이룰 수 있기를 희망합니다. 또한 딥시크를 통해 수면 위로 떠오른 AI 이슈에 대한 문제 인식과 비판적 사고를 키울 수 있는 계기가 되기를 기대해 봅니다.

 


당초 계획으로는 이번 콘텐츠를 끝으로 딥시크 편을 마무리 짓고자 했습니다만..

다음 편을 통해 딥시크 사태의 대응 방안까지 알아보고자 합니다. ( _  _ ) 

반응형