메뉴바로가기본문바로가기

동아사이언스

PDF문서에 숨은 개인정보, 클릭 한 번에 지우세요

통합검색

PDF문서에 숨은 개인정보, 클릭 한 번에 지우세요

2015.04.08 18:00
연구팀이 개발한 개인정보검출 프로그램을 실행한 화면 - 한국과학기술정보연구원 제공
연구팀이 개발한 개인정보검출 프로그램을 실행한 화면. - 한국과학기술정보연구원(KISTI) 제공

흔히 ‘PDF 포맷’이라고 부르는 전자문서에 담긴 개인정보를 자동으로 식별하고 제거해 주는 기술을 국내 연구진이 개발했다. 정보공개 시대를 맞아 다양한 정보를 주고 받는 과정에서 개인정보 보호에 큰 도움이 될 것으로 기대된다.

 

신용주 한국과학기술정보연구원(KISTI) R&D시스템개발실 책임연구원팀은 전자문서(PDF)에 포함된 개인정보만을 자동 식별, 제거하는 기술을 개발, 보급을 시행하고 있다고 8일 밝혔다.

 

KISTI는 국가 연구개발(R&D) 보고서 원문 성과물 전담관리기관으로 국내 연구기관 종사자들의 모든 보고서를 관리한다. 이 과정에서 모든 정부 보고서를 배포, 열람이 가능하도록 하는 ‘정부 3.0 공공데이터 개방’ 정책을 수행하는 과정에서 연구자 개인의 개인정보 누출 우려가 있었다.

 

KISTI 연구진은 논문이나 보고서 등에 가장 많이 사용하는 PDF 문서파일을 수정, 개인정보만 선택적으로 삭제해 주는 프로그램을 새롭게 개발했다. 주민등록번호, e메일, 전화번호, 주소, 금융정보 등을 정규 표현식(Regular Express)이란 기법을 이용해 검출한 다음, 제거하거나 검은 덧칠을 하는 방식으로 보지 못하게 할 수 있다.

 

KISTI는 지난해 이 기술을 개발해 국가연구개발사업 보고서원문 DB 구축에 활용하고 있으며, 한국연구재단 등 19개 기관에 이전했다. 3월에는 한국기초과학지원연구원 등 6개 기관에도 무상으로 기술을 이전해 활용하고 있다. 연구진은 이 기술의 상용화를 위한 추가 연구를 진행할 계획이다.

 

신 연구원은 “전자문서 형태의 정보 공개가 필요한 기관에서 필요한 기술”이라며 “문서작성에 자주 쓰는 아래아한글(HWP), 마이크로소프트워드(doc)를 비롯해 웹 언어인 XML 포맷 등 다양한 문서형태에 적용할 수 있도록 추진할 것”이라고 말했다.

 

 

태그

이 기사가 괜찮으셨나요? 메일로 더 많은 기사를 받아보세요!

댓글 0

9 + 6 = 새로고침
###
    과학기술과 관련된 분야에서 소개할 만한 재미있는 이야기, 고발 소재 등이 있으면 주저하지 마시고, 알려주세요. 제보하기