디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

OCR 방법 아이디어

몬발켜갤로그로 이동합니다. 2024.05.10 00:06:38
조회 89 추천 0 댓글 12
														

웹 서핑하다가 좋은 글 좋은 기사 있으면 스크롤 캡처해 둔다. 

그런데 캡처 내용을 글로 뽑으려고 하면 문제가 생긴다. 

캡처 그림을 보면서 열심히 타이핑하는 건 너무 지겨워서..... 

그래서 생각한 게 OCR 기능을 이용하는 건데, 

유료는 매달 돈을 내야 하니 싫고, 

무료로 가능한 것 중에서 구글 드라이브를 사용한 OCR을 사용해 봤다. 

성능이 어느 정도 만족스럽더라. 

그럼에도 불구하고 더 나은 성능을 바란다.


내게 한 가지 아이디어가 있다 

지금 화면에 표시되는 글자는 맑은고딕 폰트이고, 폰트 사이즈는 10이다. 

한글을 가나다라마바사아자차카타파하 거너더러머버서어저처커터퍼허.... 

이런 식으로 모든 글자를 1세트로 하면 1만2천 자 정도가 된다고 하더라. 

그 중에서 '가'라는 글자만 생각해 보자. 

흰색 배경색에 ㄱ, ㅏ 가 합쳐져서 '가'라는 글자가 되었다. 

'가'라는 글자를 포함하는 사각형 영역을 구하면, 

다른 곳은 다 흰 색이고, ㄱ과 ㅏ 부분만 검은색 또는 회색으로 되어 있을 것이다. 


a76d3068f5dc3f8650bbd58b368072680c

이 사각형 안의 점들의 RGB 값을 더하면, '가'라는 글자에 대한 고유 RGB 값이 나올 것이다.

그리고 다른 모든 한글 글자도 고유 RGB 값이 나올 것이다. (값이 중복될 수는 있다.)

그러면 다른 모든 한글 글자의 고유 RGB 값 리스트를 만들 수 있을 것이다. 

즉 맑은고딕 폰트이고, 폰트 사이즈가 10일 때의 RGB 값 리스트가 생긴다. 


OCR을 할 때는 글자마다 사각형 영역을 설정하고, RGB값을 더하고, 위에서 만든 리스트와 비교한다... 

그러면 틀릴 가능성이 거의 없는 OCR이 되지 않을까?





추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
2700325 멘토링하는 멘토가 SAP가 전망이 좋다고 추천하네 [2] 딘퐁갤로그로 이동합니다. 05.24 74 0
2700323 근로소득외 10원 수익창출 서비스 개발을목표를 하라 ㅇㅇ(39.7) 05.24 38 0
2700322 근데 대학원 다니는 애들은 돈 어떻게 벌어? [12] 딘퐁갤로그로 이동합니다. 05.24 115 0
2700321 한 직장에서 월급만으로의 삶에 만족하는가? [1] ㅇㅇ(39.7) 05.24 43 0
2700320 커피를 마셨는데 왜 잠이 깨질 않고 부랄이 깨냐 ㅇㅇ(180.233) 05.24 31 0
2700319 국비 루트 딱 알려줌 프갤러(220.79) 05.24 77 0
2700318 월급 받았습니다 ㅇㅅㅇ [2] 노력갤로그로 이동합니다. 05.24 63 0
2700317 프론트엔드도 너무 레드오션이네ㅡㅡ [4] 프갤러(223.62) 05.24 124 2
2700316 노동과 관련없이 월200이 통장에 꼿힐수 있는 방법은 뭘까 [2] ㅇㅇ(39.7) 05.24 60 0
2700315 내년부턴 국비지원 줄이려나보네 [7] 딘퐁갤로그로 이동합니다. 05.24 149 0
2700313 개발자말고 전산직 같은건 기피하는 이유가 물경력 [8] 딘퐁갤로그로 이동합니다. 05.24 114 1
2700312 웹 vs 앱 머가 취업 잘대냐 [2] 이제진짜공부만함갤로그로 이동합니다. 05.24 86 0
2700311 개잘하는 사람 있는 소수 개발회사 [10] 노력갤로그로 이동합니다. 05.24 116 0
2700309 코딩공부한다고 깝치지 말고 도메인을 공부해라 ㅇㅇ(106.101) 05.24 42 0
2700308 c#쓰는새끼들만 걸러도 사회생활 반은 먹고들어간다 프갤러(223.38) 05.24 58 1
2700307 <br>이 적용이 안돼는데 왜 그런거에요? [5] 프갤러(125.180) 05.24 75 0
2700306 직원7명 회사는 어때 [4] ㅇㅇ(182.226) 05.24 68 0
2700302 다녀올게 [10] 멍청한유라ㅋ갤로그로 이동합니다. 05.24 80 0
2700301 노드 4년차인데 [2] 프갤러(211.234) 05.24 70 0
2700299 맥북 이륙 괜찮나? [4] 최애의야2갤로그로 이동합니다. 05.24 57 0
2700298 나이 31인데 전산직 취직될까요? [6] 프갤러(180.64) 05.24 110 0
2700297 시니어에 인비지블 썸띵이라도 있는줄아나보네 [3] ㅇㅇ(112.150) 05.24 87 1
2700296 인생망한새끼특) 디씨에서 ai 가 어쩌구 저쩌구 [4] 섹보갤로그로 이동합니다. 05.24 85 0
2700295 솔직히ai가 좋긴하는데 헛소리가 존나 많이함 [3] 뒷통수한방(1.213) 05.24 72 0
2700294 어차피 개발 경력 쌓을수록 ㅇㅅㅇ [6] 류류(118.235) 05.24 98 0
2700293 GPT5도 시니어 못 따라잡을듯 [1] 프갤러(172.226) 05.24 65 0
2700292 GPT 젤 무서운건 비개발자가 개발하는 게 아니라 [2] 딱지(210.183) 05.24 115 0
2700291 코인 지금 9천만원 넘었음 [9] ㅇㅇ(112.150) 05.24 68 0
2700290 도를 아십니까에사 할머니와 30대~40대 청년이 저 라이팅 [2] 도리스아(119.195) 05.24 27 0
2700288 Gpt가 짠 코드를 읽을줄은 알아야함 [3] ㅇㅇ(121.186) 05.24 79 0
2700287 GPT는 딱 주니어용 [1] 프갤러(172.226) 05.24 51 0
2700286 기증Enable한지 질문 헌혈 | 조혈 모세포 기증 질문요. 도리스아(119.195) 05.24 16 0
2700284 헌혈 Vs 조혈모세포 기증. 인베가서방정 아빌리파이정 먹는중. 도리스아(119.195) 05.24 16 0
2700283 gpt 찬양하는애들보면 몇년전 코인찬양론자 보는느낌 [8] ㅇㅇ(175.210) 05.24 81 0
2700282 교수님들은 학생들이 코딩 과제에 gpt 쓰는거 어떻게 생각하심? [3] 딘퐁갤로그로 이동합니다. 05.24 60 0
2700281 가짜 ai 이지랄 하고 있네 ㅇㅅㅇ [1] 류류(118.235) 05.24 39 1
2700280 1티어 국비가 어디임? [6] 딘퐁갤로그로 이동합니다. 05.24 100 0
2700279 지피티는 걍 초기 와꾸만 좋음 [2] 키비갤로그로 이동합니다. 05.24 55 0
2700278 뤼튼쓰면 gpt4도 공짜인데 ㅇㅅㅇ [4] 류류(118.235) 05.24 73 0
2700277 나 비개발자고, 비개발 구멍가게 ㅈ소 다니는데 [3] 딱지(210.183) 05.24 75 0
2700276 Gpt는 쓸줄만알면 마법의 물건임 [4] ㅇㅇ(112.150) 05.24 67 0
2700275 전공자 부트캠프 갈 곳이 없네 쩝... 딘퐁갤로그로 이동합니다. 05.24 44 0
2700274 신입 뽑긴함 ㅇㅅㅇ 류류(118.235) 05.24 51 0
2700273 GPT 간과하는 게 개발 회사 아닌 일반 회사들은 [3] 딱지(210.183) 05.24 64 0
2700272 GPT4로 생산성이 드라마틱하게 오르진 않던데 [2] 프갤러(172.226) 05.24 56 0
2700268 평균 신입 실력이 어느정도임? [5] 프갤러(172.226) 05.24 115 0
2700267 RxFramework로 넘어와라 프갤러(121.172) 05.24 35 1
2700265 윈도우특) hiDPI 병신같아서 글자 구리게 보임 [1] 섹보갤로그로 이동합니다. 05.24 31 0
2700264 본인 국비학원 수료한지 8개월짼데 아직도 취업못함 [5] ㅅㅂ(211.36) 05.24 117 1
2700263 학원알바들이 프로그래밍 커뮤니티에 글 엄청 싸고 다니는듯 [3] 프갤러(103.212) 05.24 101 4
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2