거인은 자기 자신을 규제할 수 있는가?

로보캅이라는 영화를 보면 회사가 정부가 되려고 하지요. 도시 운영이 그렇게까지 고소득이 보장된 전망 있는 사업인가? 라는 점은 아직도 의문이지만, 1980년대의 영화에서 거대기업이 우리 삶을 장악할 수 있고 이윤을 위해서 법 따위는 씹어먹을 수 있을 것이다는 전망은 왜 이 영화가 SF 불후의 걸작 중 하나로 불리우는지 알 수 있습니다.

저는 구글 홈이라는 제품을 소개하면서 이 녀석은 항상 귀를 쫑긋이고 있다고 말씀드렸습니다. 계속 듣고 있다 자신을 부르면 그때부터 내용을 녹음까지 해서 기록합니다. 음성 검색을 한 기록도 남지요. 기록을 감사(audit)할 수 있다는 면에서보면 차라리 구글이 나을지도 모르겠습니다. 아마존은 에코로 검색한 내역이 남는지 모르겠습니다. 클로바는… 부르기 전에는 알아채지도 못하죠. 넘어갑시다, 얘는.

구글의 또 다른 서비스인 구글 포토를 사용해보면 머신러닝의 대단함을 알 수가 있습니다. 어떤 사물인지, 어디서 찍은 사진인지를 간단하게 알아채고 검색할 수 있습니다. 화질의 거의 보이지 않는 열화를 감수한다면 얼마든 무제한, 그것도 공짜로 올릴 수가 있습니다. 그렇게 구글은 머신러닝을 위한 데이터를 쌓을 수가 있습니다. 그리고 그 데이터를 바탕으로 구글은 이미지 검색의 능력을 향상시키는데 사용할 수가 있습니다.

이미지 분석을 위해 머신러닝과 AI를 사용하는 것은 구글만이 아닙니다. 대표적으로 페이스북도 마찬가지죠. 사용자의 데이터를 받아서 자사의 서비스를 향상하는데 사용할 수가 있다는 말입니다만, 비록 거기에 사람이 개입되지 않는다지만 사용자의 데이터를 업로드하는 것이 사용자를 프로파일링 하는데 사용되지 않는가 궁금합니다.

가령 이런 문제를 던져보죠. 만약 소아성애를 가지고 있는 사람이 아동포르노를 스마트폰에 저장하고 있고, 이를 자동으로 구글 포토가 저장한다고 생각해보십시오. 물론 이런 바보짓을 실제로 할 용의주도한 범인이 있을지 싶지만, 아동포르노 말고도 가족 사진이나 이런저런 다른 사진들이 섞여 있다보니 그냥 무심코 켰다고 생각해보겠습니다. 구글은 이 사용자의 사진을 읽어 플래그를 세울 수 있을지 모릅니다. 그러면 구글 AI는 이 사용자의 내밀한 데이터인–설령 그것이 인간 말종의 범죄 증거라 할지라도–사진의 내용을 바탕으로 이 사람을 신고해야 할까요? 뭐 다른걸로 바꿔도 마찬가집니다. 폭력적인 사진, 범죄의 우려가 있는 사진, 저작권을 위반하는 사진 등등등.

좀 극단적인 예였습니다만, 어떤 사람이 많이 가지고 있는 이미지에 따라 대충 그 사람의 관심사를 유추하는 것이 불가능 한 것은 아닙니다. 정원 사진이 많으면 이 사람은 정원이나 가드닝에 관심이 있는 사용자일 수 있고, 고양이 사진이 많다면 애묘 사이트에 관심을 보일지 모릅니다. 즉, 사진의 결과를 바탕으로 검색이나 광고를 조율할 수도 있다는 얘깁니다. 구글은 개별 제품이 아닌 전체 제품에 대한 하나의 프라이버시 정책약관을 가지고 있다는 점을 생각할 필요가 있습니다.

물론 구글은 공식적으로 그러한 가능성이 없음을 말하고 있습니다. 대표적으로 음성의 경우 특별히 지정한 경우가 아니라면 음성 패턴을 특정 인물과 짝짓지 않는다고 말이죠.

그러나 우리는 이것이 구글의 내부 통제의 영역에 들어간다는 점을 잘 알고 있습니다. 이를 정말 잘 지키고 있는지 여부는 구글만이 알고 있다는 얘기죠. 그래서 저는 여기서 하나의 의문을 제시하게 됩니다.

거인은 자기 자신을 억제할 수 있을까요? 비단 구글 말고 다른 여러 거인들도 마찬가지로.


Posted

in

by

Tags: