디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

언어/문자 비교

피로토스갤로그로 이동합니다. 2009.11.04 20:35:12
조회 158 추천 0 댓글 5


한글과 일본어 검색 경험을 바탕으로 두서 없이 몇 자 적는다.

언어와 문자는 서로를 규정한다.
문자는 언어에 기반해서 태어난다. 그리고 문자가 언어를 변화시킨다.
- 한글이 음절단위 문자가 된 것은, 한국어에 조사라는 특성이 있기 때문인거 같다. 영문은 조사가 없으므로 한글과 같은 표음 문자를 쓰지만 단어단위의 표기를 고안하게 된 것이라는 추측이 가능하다. 단어 단위 표기에서 중요한 것은 어절이 아니므로 주욱 단어로 쓰게 된 거 같다.
- 고대 일본어에는 지금보다 많은 발음이 있었을 것이다. 그런데 일본 문자체계의 음 표현 한계로 인해 단순화 된 것이라는 생각이 든다. 추측이다.
제주도에 남아 있는 특이한 발음. 타 지역 사람들은 구별하지 못하는 발음도 한글이 지원하지 않으므로 몇 세대에 걸쳐 서서히 사라져갈 것이다. 그 음이 고대 한글에는 있었다는 사실도 주목하자.

전산 처리
- 일단 모든 언어는 모호성이 필연적으로 존재한다. 완벽한 자동 번역 시스템은 불가능하고, 같은 뿌리의 언어간에만 좋은 결과를 낼 수 있다.(아직까지는)
따라서 의미해석의 비교보다는 파싱(토크나이징 또는 태깅)에 대해 주로 논해보자.
- 영어의 전산처리가 우리보다 앞 서 있다. 이건 한국어를 사용하는 개발자들이 못나서이지 한국어/한글이 떨어진다는 근거가 될 수는 없다.
- 언어마다 전산 처리를 할 때 장단점이 존재한다. 코드화 하는데는 알파벳이 전적으로 유리하고, 키보드 입력도 알파벳이 한자보다 월등히 우수하다.
- 단어의 의미를 해석할때는 표의 문자가 유리하다. 한자는 띄어쓰기를 중요하게 생각 안 하므로, 한글과 일본문자에서 골치아파하는 띄어쓰기 문제가 상대적으로 훨씬 적다.
- 일본문자는 띄어쓰기가 모호한 문장에 대해서 한글보다 우수한 분리가 가능하다. 왜냐하면 히라가나와 카타가나와 한자가 섞여 있기 때문이다. 히라가나에서 한자로 바뀌는 부분에서 단어 분리를 하면 된다. 한글은 여러 단어가 묶여 있는 새로운 단어 또는 단어처럼 사용될 수 있는 집합 단어에 대해 붙여 쓰는 경향이 있다. 예를 들어 보자. 대학생들이 선교회를 만들었다. "대학생 선교회"가 된다. 요게 자주 쓰이다보면 하나의 단어처럼 붙여서 쓰이게 된다. "대학생선교회" 이걸 어떻게 분리할 것이냐? 잘 못 분리하면 대학+생선+교회 가 된다.
- "너는", "넌" 둘은 같은 의미이다. 하지만 다른 글자로 표현된다. 영어에서 he is 와 he\'s 도 같은 의미이지만 한글처럼 큰 변화는 아니다.
- 일본문자로 서울역과 같은 역을 적을때 \'에키\'라고 적지 않고, 항상 驛으로 적는다. 그래서 파싱하는데 별 불편함이 없다. 한글은 역 이라는 문자를 만나면 이게 정말 서울역을 얘기하는건지 "서울역시 멧돼지가 정ㅋ벅ㅋ" 라고 쓴건지 판단하는게 아무래도 어렵다.
- 일본애들은 검색용 데이터를 만들 때, 명칭 컬럼을 두 개 만든다. 하나는 히라카나이고 또 하나는 가타카나이다. 따라서 문자와 발음으로 동시에 검색하는데 어려움이 없다. 근데 얘들이 이렇게 하는 이유는 하나의 한자라도 다른 음으로 읽히기 때문이다. (특히 지명)

우월성
- 어떤 언어가 더 우월하다고 얘기하는 것은 위험하다. 그것은 곧 어느 문화가 더 우월하다는 것이 되고, 곧 어느 인종이 더 우월하다고 얘기하는 것과도 통한다. 그래서 위험하다는 것이다.
모든 언어는 품사적으로 표현 못 할 것은 없다고 본다. 과거형, 현재형, 미래형 등의 시제 표현이 불가능한 언어가 과연 있겠나?
다만 문화의 차이일 뿐이다.
- 어떤 문자가 더 우월하다고 얘기하는 것도 위험한가?
한글이 제일 우월하다. 시발. 고마해라. 만원 아니냐 만원. 그러니 한글 전산화에 니들이 좀 기여하란 말이다. 전에도 얘기했잖냐? 영어권에서 만든 정규표현식은 한글을 완벽하게 지원하지 못하고 있다. 내가 쓴 이 글에서 받침이 니은으로 끝나는 단어만 추출하려면 정규표현식으로 불가능하다. [간갠갼...]으로 찾으면 되지 하는 새퀴도 있겠지만, 제발 그렇게 살지 말자.

고리타분해서 미안하지만...
앞에서도 얘기했지만 언어와 문자는 서로를 규정한다.
아륀지 같은 좆같은 소리는 집어 치우고, 한국어와 한글을 잘 쓰는게 중요하다.
그리고 원서 보는 것도 중요하지만, 번역본을 잘 만드는것도 중요하다. 그래야 글로벌 경쟁력이 강해질 수 있다.
한국 사람이 제일 잘 이해할 수 있는 언어가 한국어 이기 때문이다.

예를 하나 들어보자.
미군의 전투기 파일럿은 공군에도 있고 해군에도 있다.
어느 놈이 공중전을 더 잘 하겠냐? 기체의 우열은 없다고 가정하자.
공군 소속이 이긴다가 답이다. 왜냐하면 해군 파일럿은 훈련시간의 상당부분을 이착륙에 할당하기 때문에 공중전 훈련이 공군보다 부족하기 때문이다.
그러니 영어공부에 상당부분을 할애하는 한국의 개발자는 영어권 개발자보다 불리하지 않겠냐?


추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 연예인 안됐으면 어쩔 뻔, 누가 봐도 천상 연예인은? 운영자 24/06/17 - -
169418 연봉협상 시기가 입사후 1년후 인가요? [1] 굿(116.45) 10.02.04 154 0
169417 이래도 되는가 싶다. [2] ㅇㅇ(119.149) 10.02.04 104 0
169416 형들아 윈도우7 불법다운후 정품 인증 방법점 [2] asdf(211.117) 10.02.04 264 0
169415 늅인데질문좀ㅇㅕ 잇힝/갤로그로 이동합니다. 10.02.04 41 0
169414 컴공의 암울한 미래에 대한 글이 많네.... [8] ㅇㅇ(222.234) 10.02.04 305 0
169413 형님들. PHP 랑 HTML 배울려는데 책좀 추천부탁드려염. 하하하™갤로그로 이동합니다. 10.02.04 49 0
169412 형들.. 여기서 항상 내 이미지가 깝치는 병진 똘아이지만 나도 고민이있어 [2] 형들아(220.73) 10.02.04 176 0
169410 프로그래머 하면 하루에 말 몇마디 해요?? [5] DD(203.229) 10.02.04 241 0
169409 프로그래머 -> 퍼블리셔 이직 그후 [1] (211.211) 10.02.04 137 0
169408 외국의 인터넷 뱅킹은 엑티브엑스 안쓴다는데 그럼 어케 인증? [3] 소쩍궁갤로그로 이동합니다. 10.02.04 156 0
169407 티비에서 슈프리마 지문인식 나오는데 소쩍궁갤로그로 이동합니다. 10.02.04 42 0
169405 저 늅늅인데 질문좀 할께요 [1] 네레갤로그로 이동합니다. 10.02.04 76 0
169400 빌게이츠는 모르겠는데 스티븐 잡스는 많지않아 ? [4] Only.갤로그로 이동합니다. 10.02.04 187 0
169398 횽들 왜 글 안쌈? [1] LightEach갤로그로 이동합니다. 10.02.04 64 0
169395 하늘이_프로그래머_하라고_내려주신_분.jpg [2] 걷는사람갤로그로 이동합니다. 10.02.04 363 0
169394 들린다 [6] 유리한갤로그로 이동합니다. 10.02.04 91 0
169393 패리스 힐튼이 남자를 성폭행? [3] 물속의다이아갤로그로 이동합니다. 10.02.04 249 0
169392 땅박쉑히가 왜 정통부 없앴지? [6] 이모군(211.40) 10.02.04 181 0
169391 어제 회사 과장님이랑 술먹다 졸라 깜짝 놀랄만한 회사 사장님 얘길 들었어 [2] 물속의다이아갤로그로 이동합니다. 10.02.04 205 0
169390 아오 아이튠즈 빡치네 -_-;; 음악 파일 동기화 하는건 한컴터에서 밖에 [5] 외계달팽갤로그로 이동합니다. 10.02.04 203 0
169389 아래 한국서 빌 게이츠나 스티브 잡스 나와야 한다는 기사 보다가 느낀건데 [22] 물속의다이아갤로그로 이동합니다. 10.02.04 286 0
169388 showModalDialog 리턴값 있다하지 않앗나?? [1] 너는이미갤로그로 이동합니다. 10.02.04 87 0
169387 “보세요. 우리 제품의 뒷면은 타사의 제품 앞면보다 아름답습니다.” [2] 온순한감자갤로그로 이동합니다. 10.02.04 180 0
169386 스티브 잡스 유명한 일화 [3] ㅇㅇㅃ갤로그로 이동합니다. 10.02.04 632 0
169385 근데 서버도 클라이언트도 급이 있잖어 ^^(118.131) 10.02.04 66 0
169384 스티브 잡스 연설문 (옛날꺼지만 끌어올리기) [2] 온순한감자갤로그로 이동합니다. 10.02.04 1617 0
169383 MB "한국서 빌 게이츠나 스티브 잡스 나와야" [7] dd(99.236) 10.02.04 226 0
169382 리뷰 동영상만 보면 모토로이가 반응이 좀 늦은 거 같음 [2] 오사카(221.153) 10.02.04 88 0
169381 화상되는 랜덤채팅도 있네 [2] 폐인의세계갤로그로 이동합니다. 10.02.04 3750 0
169380 웹개발자나 어플개발자(?) 고졸은 초봉이 어느정도????!! [3] 고졸똘뫄니(211.223) 10.02.04 203 0
169378 매운거 잘 먹는 횽들 폐인의세계갤로그로 이동합니다. 10.02.04 56 0
169377 형들 핵쉴드 질문좀 ㅠㅠ [4] 듣보(121.157) 10.02.04 214 0
169376 붕유의 어리석음 이모군(211.40) 10.02.04 46 0
169375 pg어가 먼가여? [2] 개로그갤로그로 이동합니다. 10.02.04 146 0
169373 잡스가 플래쉬를 싫어하는 이유 [9] Vita500갤로그로 이동합니다. 10.02.04 377 0
169372 asp.net 질문!! 너는이미갤로그로 이동합니다. 10.02.04 28 0
169371 매크로 익스프레스 고수분 계신가요? 만들어주셨으면 하는게 있는데.. [1] 매쿠로(211.253) 10.02.04 103 0
169370 나 지금 주민등록번호 털리게 생겼음 [6] 유리한갤로그로 이동합니다. 10.02.04 169 0
169369 Q횽은 봅니다. (도쿠위키) [1] ∫ 2t dt=t²+c갤로그로 이동합니다. 10.02.04 194 0
169368 취미로 프로그래밍배워도 되나여? [3] ㅁㅁ (119.67) 10.02.04 167 0
169367 C# 간단한 질문하나 할께요 [1] 늅늅(210.121) 10.02.04 80 0
169366 서울에 있는 회사에서 인턴해보려고 하는데... [7] 리즈릿트갤로그로 이동합니다. 10.02.04 173 0
169365 이런 글 자주 올라오지만 ... [2] 식상한놈(121.177) 10.02.04 88 0
169364 한국에 잡스가 없는 이유 [4] 피로토스갤로그로 이동합니다. 10.02.04 161 0
169363 혹시 여기 VMS 써보신분있으신가요 ㄷㄷ 위디안갤로그로 이동합니다. 10.02.04 43 0
169362 애플과 플래시 읽을거리 [9] 피로토스갤로그로 이동합니다. 10.02.04 154 0
169361 서버 옮겼음 [5] ∫ 2t dt=t²+c갤로그로 이동합니다. 10.02.04 128 0
169360 세경씨_그렇게_안봤는데_은근히_반말하는거_같은데.swf [2] 유리한갤로그로 이동합니다. 10.02.04 179 0
169355 웹브라우져는 그냥 IE8 써라.. [4] \'ㅅ\'(112.164) 10.02.04 134 0
169354 여기 아이폰 겜 만드는 애들 없냐?? [1] 드웤(211.189) 10.02.04 69 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2