상세 컨텐츠

본문 제목

PDF파일에서 글씨 추출하기~!

- Review -/디지털+가전

by 꼬도기 2014. 10. 11. 00:47

본문

반응형

보고서를 쓸 때에나 서류 작업을 할 때 pdf 파일을 주로 사용하게 되는데

 

pdf파일이지만 이미지파일이기 때문에 복사를 할 수 없어서 자료 조사나 자료를 바탕으로 글을 쓸 때

 

이미지 파일을 켜 놓은 채로 보면서 직접 타이핑을 하는 수고를 하는 일이 많을 것이다.

 

이미 이미지화된 pdf파일이지만 어떻게 해볼 수 없을까? 하고 생각해보고

 

검색해보니 다음과 같은 기술이 있었다.

 

OCR

 

광학식 문자 판독기

 

로서 사람이 쓴 문자를 읽는 장치라고 한다. 이런 것이 있었을 수가~!

 

그동안 몰라서 직접 타이핑했던 친구들 이젠 고생길 바이바이~

 

그렇다면 이러한 프로그램을 사용하기 위한 방법에 대해 알아보자.

 

 

1. 네이버

 

http://t.lab.naver.com/ocr/

 

네이버가 무료로 이미지 문자인식 기술을 제공해주고 있다. 사이트에 접속하면 어떻게 해야하는지 방법도 친절하게 알려주고 있다.

대신 단점이 있다면 직접 해본 결과... 시간이 너무 많이 소요되며 인식도 제대로 되지 않았다.

 

2. Adobe사의 Acrobat XI Pro 프로그램 사용하기

 

* 다운로드 방법

http://www.adobe.com/kr/products/acrobatpro/reviews-awards.html

Adobe사의 홈페이지에 들어가서 오른쪽에 다운로드라고 있다.

http://get.adobe.com/kr/reader/

다운로드 받으면 된다. Acrobat XI Pro 가 다운로드 된다

(단! Adobe사에 가입 아이디가 있어야 한다. 가입절차는 많은걸 요구하지 않고 간단하므로 그냥 가입 추천)

 

* 사용방법

 

 

 

이미지 파일에 마우스를 갖다 대고,

 오른쪽마우스 클릭 -> Adobe PDF로 변환

 

 

 

 

이미지파일을 뜨자마자 저런 창이 뜨는데, 문자분석을 실행하시겠습니까? 창이 떠야지 OCR이 되고 파일 복사가 가능해진다.

 

만약 저 창이 뜨지 않는다면, 위에 '텍스트강조' 아이콘을 한번 눌러보자.

 

 

설정 : 한국어로 설정할 것이므로 바꿀 생각하지 말고 바로 확인버튼을 누른다.

 

 

 

조금만 기다리면 저렇게 이미지파일에 드래그가 가능하고,

 

전체 드래그를 한 뒤에 복사 붙여넣기를 하면 !!! 저 글씨 그대로 나오게 된다.

 

이미지 화질이 좋지 않은데도 불구하고 빠르고 쉽게 이미지파일에서 글자를 가져올 수 있었다.

 

 

 *  또 다른 Tip

 

 

 

도구 - 다른형식으로 파일 내보내기 - Word문서로 하시던지 97파일로 하시던지 마음대로 선택하시고 - 저장

 

(단! 저의 화질 구린 이미지파일에서는 파일 변환이 안된다고 하네요 ㅜㅜ 눈물)

 

아마 이 방법은 이미지파일이 아니라 원래 문서파일이었는데 드래그가 되지 않는 문서파일에서 따올 때 쓰는 방법인 듯 합니다.

 

개인적으로 위에 방법을 추천드립니다~~

 

 

결과적으로 Acrobat XI Pro 프로그램이 최고~!!!

반응형

관련글 더보기

댓글 영역