IBM “기업 데이터의 1%만 AI에 쓰인다…가장 큰 문제는 ‘데이터 전략 부재’”

한국IBM 기자간담회
이수정 한국IBM 사장이 9일 서울 영등포구 여의도에 위치한 한국IBM 미디어 오픈하우스에서 발표하고 있다. 한국IBM 제공


국내 기업들이 인공지능(AI) 도입을 서두르고 있지만, 실제로 AI가 활용할 수 있는 데이터는 기업이 가진 전체 데이터의 1%에 불과하다는 분석이 나왔다.

IBM은 9일 서울 여의도에서 기자간담회를 열어 이러한 결과의 원인에 대해 “기술 부족이 문제가 아니라, 데이터를 다루는 전략 자체가 부족하다”고 진단했다.

이수정 한국IBM 사장은 “AI 성과는 결국 ‘기업 고유 데이터’를 얼마나 잘 쓰느냐에 달려 있다”며 “하지만 많은 기업은 데이터를 부서별로 따로 보관하고, 형식도 제각각이라 AI가 학습 가능한 상태가 아니다”라고 말했다. 실제로 IBM 조사에서 글로벌 CEO 72%가 ‘기업 내부 데이터 활용 능력’을 AI 성공의 핵심 조건이라고 답했지만, 국내 최고데이터책임자(CDO) 중 AI로 매출을 만들 수 있다고 답한 비율은 13%에 그쳤다.

기업들이 어려움을 겪는 이유는 대부분 ‘기초 작업’이 부족해서라는 게 IBM의 진단이다. 문서·PDF·이미지 같은 비정형 데이터가 전체의 90%를 차지하는데, 이는 숫자처럼 바로 분석할 수 없어 사람이 일일이 정리해야 한다. 이 사장은 “기업 데이터 프로젝트의 90%가 실제 분석이 아니라 자료를 모으고 정리하는 데 쓰인다”며 “문제는 AI 기술이 아니라 데이터 준비가 안 돼 있다는 것”이라고 강조했다.

IBM이 제안한 해법은 ‘AI에 바로 활용할 수 있는 데이터 만들기’다. 이를 위해선 여러 부서에 흩어진 데이터를 연결하고, 형식·품질을 통일하는 한편, 접근권한을 관리하고, 문서·이미지 같은 비정형 데이터를 구조화하는 것이 필요하다. 쉽게 말해 “AI가 읽을 수 있는 언어로 데이터를 정리하는 과정”을 기업의 핵심 전략으로 격상해야 한다는 뜻이다.

홍규표 IBM 데이터 플랫폼 기술영업 부장은 “예를 들어 PDF 수천 건을 자동으로 글자로 변환하고(문자인식), 의미 단위로 쪼개 AI가 이해할 수 있게 저장하면 회사 내부 정보도 검색·요약·분석이 가능해진다”며 “이 과정이 되어 있어야 생성형 AI의 효과도 극대화된다”고 설명했다.

IBM은 이를 지원하기 위해 데이터 관리 플랫폼 ‘왓슨x.data’를 중심으로 기술 투자를 확대하고 있다. 지난해 데이터 처리 기업 ‘데이터스택스’를 인수한 데 이어, 최근에는 실시간 데이터 전송 기술을 가진 ‘컨플루언트’(Confluent)까지 인수 의사를 밝히며 데이터를 하나로 통합하는 기반을 강화했다.

이 사장은 “AI는 이제 기술 부서의 과제가 아니라 경영 전략”이라며 “데이터 품질과 보안 기준을 세우고, 조직 전체가 같은 방식으로 데이터를 다루어야만 AI 투자 효과가 난다”고 말했다. 이어 “한국 기업이 글로벌 대비 느리다고 평가받는 이유도 결국 데이터 준비 부족”이라며 경영관리·IT·현업 부서가 함께 움직이는 ‘전사 데이터 전략’을 강조했다.
ⓒ 트윅, 무단 전채 및 재배포 금지
연예의 참견
여기 이슈
갓생 살기