디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

LG AI연구원, 이미지를 문장으로 변환하는 AI 공개[AWS 리인벤트 2023]

IT동아갤로그로 이동합니다. 2023.11.30 00:54:22
조회 100 추천 0 댓글 0
[IT동아 남시현 기자] LG그룹의 인공지능 연구 허브인 LGAI 연구원이 AWS 리인벤트 2023에서 이미지를 텍스트로 전환하는 인공지능 기술을 선보인다. 또한 엑사원 2.0을 추후 아마존 베드록으로 마이그레이션(전환)하는 등 인공지능 분야에서 다각적으로 협력한다. 그간 프롬프트(명령어)를 입력해 텍스트를 메시지로 만들거나, 텍스트를 동영상으로 만드는 기술 등을 선보인 사례는 많지만, 이번 기술은 상업 및 기업용 용도로 이미지를 텍스트로 전환하는 기술이라는 점에서 차이가 있다.

새로운 인공지능 기술은 3천억 개의 매개변수를 갖춘 LG AI연구원의 멀티모달 기반 모델인 엑사원(EXAONE)을 활용하며, 인간의 인지 능력과 유사하게 이전의 경험과 지식, 훈련을 바탕으로 본 적 없는 객체나 장면을 자동으로 이해하고 설명한다. 사람이 어떤 이미지를 능동적으로 설명하고 소개하는 것과 유사한 개념으로 설명한다.


LG AI연구원이 만든 이미지 투 텍스트를 사용해 사진을 문장으로 변환한 결과 / 출처=LG AI연구원



동작 환경은 한국어와 영어로 된 이미지와 텍스트를 이해하며, 이를 실현하기 위해 LG AI연구원은 AWS의 완전관리형 AI 서비스인 세이지메이커를 사용해 약 3억 5천만 개의 고해상도 이미지와 텍스트를 학습시켰다. LG AI 연구원은 지난 2022년 CVPR(컴퓨터 비전과 패턴 인식 콘퍼런스)에서 해당 기능을 처음 선보였으며, 1년 간 완성도와 상업성을 가다듬어 아마존 세이지메이커 점프스타트를 통해 제공하게 됐다.

이미지 텍스트화, 언어의 장벽 넘는 도구 될까


도입 배경에 대해 이화영 LG AI연구원 상무는 “미국에서는 장애를 이유로 하는 차별을 명확하고 포괄적으로 금지하기 위한 법률이 있다. 따라서 시각 장애인이 사내 자산인 이미지 등을 구분할 수 없으면 권리 보호를 위해 폐기해야 한다. 이런 경우에 이미지를 텍스트로 만드는 기술을 도입하면 애써 만든 자산을 폐기하지 않고 계속 사용할 수 있다”라면서, “기업에 따라 다르지만 최대 수백만 달러까지 비용을 절감할 수 있다는 예측이 나오고 있다”라고 덧붙였다.


미국 네바다 주 라스베이거스에서 열리는 AWS 리인벤트 특성상, 인터뷰는 화상 회의로 진행됐다 / 출처=IT동아



이어서 “LG전자만 하더라도 전 세계에 100개가 넘는 법인이 있다. 각 법인에서는 사진 등의 결과물을 라이브러리로 보관하는데, 언어 체계가 다르다 보니 데이터를 공유하고 확인하는데 한계가 있다. 이 기술을 활용하면 언어가 다르더라도 비교적 쉽게 타 법인의 자산을 확인할 수 있어서 전반적인 콘텐츠 비용도 낮출 수 있다”고 덧붙였다.

그렇다면 GPT처럼 이미지를 설명해 주는 기존 AI와는 어떻게 다를까. 이화영 상무는 “GPT의 경우 이미지를 장황하고 세부적으로 설명하지만, 시간이나 속도 측면에서 느리고 또 틀린 내용도 유입된다”라면서, “반면 이미지 투 텍스트 변환 솔루션은 특수 목적으로 용도를 지정할 수 있고, 장애인이 이해하기 쉬운 용어들을 쓴다. 또 여러 번 생성해 정확도 순위를 매기는 식으로 품질을 높이는 알고리즘이 적용돼 환각 현상도 적다”라고 설명했다.


아마존 세이지메이커 점프스타트에 업로드돼있는 이미지 투 텍스트 모델 / 출처=AWS



소비재기업, 마케팅 에이전시 등 LG AI연구원의 고객사는 AWS의 확장성을 활용해 시간당 최대 2000장의 이미지에 설명글을 달 수 있으며, 또 현장에서 별도로 고도화 작업을 거치지 않고 그대로 사용할 수 있다. 이화영 상무는 “이미 건설 현장 안전점검용 드론으로 촬영한 이미지를 텍스트로 변환해 문제점을 확인한다거나, 장애물이 확인되는 등의 용도로 쓸 수 있음을 확인했다”라는 설명을 추가했다.

AWS와의 협업, 더 큰 그림 그리는 LG AI연구원


마지막으로 이화영 상무는 앞으로 AWS와 더 많은 부분에서 협력할 뜻을 내비쳤다. 이화영 상무는 “AWS의 인공지능 생태계는 사용자 중심적이다. 세이지메이커만 하더라도 학습부터 배포까지 일괄로 편리하게 작업할 수 있다. 이런 시각은 LG그룹이 추구하는 바와 뜻이 맞기 때문에 앞으로도 협력할 예정이다”라면서, “추후에는 엑사원 2.0을 아마존 베드록으로 마이그레이션하고, LG 계열사뿐만 아니라 B2B 파트너사들도 같이 쓰는 방식 등에 대해서도 고려하는 중”이라고 말했다.

글 / IT동아 남시현 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ AWS, 생성형 AI 베드록·새 AI 반도체로 '초가속'한다 [AWS 리인벤트 2023]▶ 세계 최대 클라우드 행사 시작··· 이목은 'AI'에 집중 [AWS 리인벤트 2023]▶ 윤석찬 AWS 수석 “AWS 게임데이 LoL 에디션, 머신러닝 서비스 구축 기회 제공”



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
3305 서울 대중교통·따릉이 무제한 이용...'기후동행카드' 오는 27일 출시 [2] IT동아갤로그로 이동합니다. 01.03 602 0
3304 [리뷰] 개선된 공간음향으로 몰입감 강화 ‘LG 톤프리 UT90S’ [4] IT동아갤로그로 이동합니다. 01.03 1211 2
3303 [IT애정남] 폰카로 해·조명만 찍으면 생기는 빛줄기, 해결법은? [5] IT동아갤로그로 이동합니다. 01.02 3494 5
3302 [혁신스타트업 in 홍릉] 에스엠하엘 “펩타이드로 약물 중독·피부 염증 완화” IT동아갤로그로 이동합니다. 01.02 100 0
3301 중고 스마트폰, 비대면으로 간단히 판매하려면 이렇게![이럴땐 이렇게!] [9] IT동아갤로그로 이동합니다. 01.02 3751 0
3300 [이제는 전북 콘텐츠] 홍인근 작가 “웹툰 작가의 꿈을 전북에서 완성했습니다” [25] IT동아갤로그로 이동합니다. 23.12.29 8945 7
3299 [KIDP 울산] 한컴유비마이크로 [3] “현대미포조선 현장의 안전을 개선하고 있습니다” IT동아갤로그로 이동합니다. 23.12.29 124 0
3298 가상자산 거래소, 가상자산법 시행 앞두고 이용자 보호 강화 IT동아갤로그로 이동합니다. 23.12.29 127 0
3297 [이제는 전북 콘텐츠] K-게임의 미래를 이끌어 갈 ‘전북 글로벌게임센터’ [12] IT동아갤로그로 이동합니다. 23.12.29 937 1
3296 [KIDP 울산] 옛간·굽스디자인 “전통에 개성 더한 곡물 식품 함께 만든다” IT동아갤로그로 이동합니다. 23.12.29 105 0
3295 [스타트업-ing] 본투비 “크리에이터 시장 트렌드에 맞춰 진화한다” IT동아갤로그로 이동합니다. 23.12.29 106 0
3294 [서울형 R&D] "SBA는 스타트업 성장을 함께하는 파트너입니다" IT동아갤로그로 이동합니다. 23.12.29 90 0
3293 웍스메이트 “디지털 건설의 새 가치, 2024년 전국에 전파” [3] IT동아갤로그로 이동합니다. 23.12.29 394 0
3292 [KIDP 울산] 트레비어 [3] “맥주박과 효모를 사용한 상품 확대를 고민합니다” IT동아갤로그로 이동합니다. 23.12.28 92 0
3291 [서울형 R&D] 기술 개발부터 현장 테스트까지 지원합니다 IT동아갤로그로 이동합니다. 23.12.28 137 0
3290 [스케일업] SBA 스타트업 “홍보·성장에 유용…멘토링·행사 지원 더하길” IT동아갤로그로 이동합니다. 23.12.28 90 0
3289 부산 워케이션 센터 살펴보니··· "지역 상생과 워라밸 모두 잡아" IT동아갤로그로 이동합니다. 23.12.28 82 0
3288 [스케일업] 현대건설·에이랩스 “이산화탄소를 산업재로 사용할 수 있습니다” IT동아갤로그로 이동합니다. 23.12.28 83 0
3287 [인터뷰] 음악 크리에이터가 '라디오' 소셜 플랫폼만 고집하는 이유는? [2] IT동아갤로그로 이동합니다. 23.12.28 857 0
3286 2024 시스템·메모리 반도체 시장 전망··· 'AI, 왕도로 가는 길' [3] IT동아갤로그로 이동합니다. 23.12.28 837 0
3285 코스모화학 “폐배터리도 중요자원? KIAT 기반구축사업 통해 현실화 성큼” IT동아갤로그로 이동합니다. 23.12.28 292 0
3284 [KIDP 울산] 한컴유비마이크로 [2] “화재, 화학사고 등 위험 현장의 안전을 개선합니다” IT동아갤로그로 이동합니다. 23.12.27 112 0
3283 기차·택시 대리 예약은 이렇게![이럴땐 이렇게!] [3] IT동아갤로그로 이동합니다. 23.12.27 2961 0
3282 [KIDP 울산] 볼로랜드·김유광 “드론 스테이션 표준화 후 새 영역 개척” IT동아갤로그로 이동합니다. 23.12.27 97 0
3281 [서울형 R&D] R&D 생태계 구축을 위한 마지막 단추, '서울테크밋업’ IT동아갤로그로 이동합니다. 23.12.27 89 0
3280 대한의료정보학회 연구회 “의료데이터 가치평가·유통 토대 구축” IT동아갤로그로 이동합니다. 23.12.27 86 0
3279 [서울형 R&D] 민간 투자와 연계해 기술 개발을 지원합니다 IT동아갤로그로 이동합니다. 23.12.26 80 0
3278 [스타트업-ing] 우당네트웍 “아토피 치료·관리, 해듭으로 해결” [2] IT동아갤로그로 이동합니다. 23.12.26 842 0
3277 [KTVF] 펀더풀 “온라인 소액 투자 통해 문화 콘텐츠 산업 발전에 기여한다” IT동아갤로그로 이동합니다. 23.12.26 86 0
3276 2023년 경북글로벌게임센터, 산학연 아우르는 산업 생태계 조성 노력에 ‘눈길’ IT동아갤로그로 이동합니다. 23.12.22 126 0
3275 2024 가상자산 시장 전망 “제도권 편입 기대감으로 강세장” [5] IT동아갤로그로 이동합니다. 23.12.22 708 0
3274 KOAT “농식품 벤처육성 지원사업 확대, 스타트업 가뭄 해갈” IT동아갤로그로 이동합니다. 23.12.22 120 0
3273 [스타트업-ing] 바이오뉴트리온 “맞춤 영양에 인지행동 치료로 통합적 비만 관리 제공” IT동아갤로그로 이동합니다. 23.12.22 124 0
3272 [KIDP 울산] 우시산·김유광 “초대형 업사이클링 프로젝트로 가치 차별화” IT동아갤로그로 이동합니다. 23.12.22 298 1
3271 이상찬 울산시 건설주택국장, “디자인은 산업도시 울산의 새로운 성장 기회입니다” IT동아갤로그로 이동합니다. 23.12.21 196 1
3270 [리뷰] 최대 27kg·57인치까지 지원, 카멜마운트 PMA2X 모니터암 [3] IT동아갤로그로 이동합니다. 23.12.21 656 0
3269 각기 따로 노는 지능형 교통체계, 클라우드로 묶으면? IT동아갤로그로 이동합니다. 23.12.20 111 0
3268 공공망분리 규제 완화 분위기, 주목 키워드는 ‘DaaS’ [3] IT동아갤로그로 이동합니다. 23.12.19 573 0
3267 SBA “민관 협력 오픈 이노베이션 촉진, 유니콘 요람으로” IT동아갤로그로 이동합니다. 23.12.19 118 0
3266 [리뷰] 세계 최초의 3nm 기반 칩으로 활용도↑ 애플 맥북 프로 14 [4] IT동아갤로그로 이동합니다. 23.12.19 1065 3
3265 [스케일업] 스쿨버스 [3] “통학차량 구성원들과 함께 성장하고 있습니다” IT동아갤로그로 이동합니다. 23.12.19 144 0
3264 [혁신스타트업 in 홍릉] 그리니쉬 “퍼티맥스로 난임 해결 힘 싣는다” IT동아갤로그로 이동합니다. 23.12.19 110 0
3263 [IT애정남] 구형 PC에서 4K 동영상 보려면 어떻게 업그레이드? [6] IT동아갤로그로 이동합니다. 23.12.18 1755 2
3262 [스케일업] 1인치 [2] “가게 사장님들과 함께 단골가게를 만들고 있습니다” IT동아갤로그로 이동합니다. 23.12.18 96 0
3261 정부민원·서류 발급, 비대면으로 하려면 이렇게![이럴땐 이렇게!] [2] IT동아갤로그로 이동합니다. 23.12.18 1174 0
3260 [스케일업] 스쿨버스 [2] “통학차량의 현실적인 규제와 기준, 허가를 희망합니다" [3] IT동아갤로그로 이동합니다. 23.12.18 760 0
3259 랜섬웨어 공격에 유출된 ‘골프존’ 개인정보, 어떡하지? [14] IT동아갤로그로 이동합니다. 23.12.15 8988 11
3258 [자동차 디자人] 누구나 꿈꾸는 드림카 ‘페라리’의 디자인 수장 ‘플라비오 만조니’ [5] IT동아갤로그로 이동합니다. 23.12.15 4394 5
3257 "퓨리오사AI의 기술 블로그, 무엇을, 어떻게, 왜 하는지 담을 것" IT동아갤로그로 이동합니다. 23.12.15 147 0
3256 aT센터 “농가, 온라인 배 태워 더 넓은 시장으로” IT동아갤로그로 이동합니다. 23.12.15 115 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2