HyperCLOVA by 성낙호 책임리더.
: 한국어 초 거대 언어모델
5600억. 한국어 데이터.... 50년치 뉴스의 양.
: 700PF 슈퍼컴퓨터.
: 204B
: 비지도 학습방법론 cf) 지도 학습방법: 사람이 정해준것을 학습.
![](https://blog.kakaocdn.net/dn/de49gB/btq5FVf7jmJ/XqFUArYj36ovEmVmRNEvz0/img.png)
규모가 클때 더 효율적일 수도 있었다.
기존AI 수개월 걸릴것이 몇분만에 해결
1. 맥락을 이해하는 자연스러운 대화.
- 별도 데이터셋 구성할 필요가 없었다.
- 사용자 만족감 높이는 디테일요소 놓치지 않았다.
- 20회이상 주고 받는 대화 가능. 완벽하게 문장을 매번만들지 않아도 된다.
2. 창작을 도와주는 글쓰기.
- 네이버 상품 소개 : 노출 적합도 채택률 99%
3. 정보요약
- 여러문서에서 요약해서 보여줌.
4. 데이터 생성
- AI 만들어준 문장 필터링하는 수준가능.
- 대화 시나리오 구축생산성 상승.
>> AI활용이 빠르고 쉬워짐.
![](https://blog.kakaocdn.net/dn/bw2Sc7/btq5GgSkTpG/4zXulnw2FKXata4JdLg2kK/img.png)
네이버 클라우드 by 황인용
Super Computer
![](https://blog.kakaocdn.net/dn/wTLlZ/btq5J08PTYL/D69eRiUSognNyDP1PYzRGk/img.png)
GPT-3
대규모 AI서비스를 병렬로 GPT 학습.
한국어 일본어의 초거대 언어모델 만들고 있다.
슈퍼컴퓨터.....글로벌 top 500List 상위권.
1. 고성능 병렬 GPU 클러스터
2. 초 저지연 고대역폭 네트워크
3. 고성능 병렬 아키텍처 스토리지. : GPU 메모리로 데이터 직접 전송. 일반보다 2배이상 성능.
향후
슈퍼컴퓨팅 클러스터 확장 x 다양한 AI 가속 솔루션 모색.
Hyper CLOVA를 위한 Big Data 강인호 책임리더. NLP 부서
딥러닝
다양한내용 - 범용의 구성- 양질의 정보 - 충분한크기 .
치우치지 않는 다양한것, 검색, Q&A 생성 등 확용가능.
한국에 있는전반적인 데이터를 가져와.....
- 데이터 구성-
전문지식
신뢰할수 있는 출처의 오픈된 리소스 :
검색 헝용된 문서 : 품질순 줄을 세움.
기반지식 : 객관적사실
............문서 내용 유사한 경우 중복제거 ::: 한쪽내용 치우치지 않게 하기 위해.
............개인정보 : 비식별화.
- 범용의 구성: 유의미한 구조로 변경:
질문 : 답변 구조로 재배치.
메타 정보도 추가. : 화자 ID , 출처정보, 카테고리 정보,
네이버: 검색로그, 서비스 로그 : 정보성, 신뢰도, 인기있는 출처 상위품질 포함되도록.
상위 품질 문서에도 ... 웹페이지 핵심영역 판정, 기계학습영역 만들어 포함시킴.
저품질 문서 필터링, : 의미 없는 단어의 나열, 비속어나 유해정보 제거, 서비스 별 홍보, 스팸 판별결과 활용.
최종. 1.96 TB. 데이터셋 만듬. .. 상기 중복내용...
기존 NLP 테스트..
멀티 모델리티 측면 ... 동영상등... 구축예정.
NLP : Natural language processing: 자연어처리
세계적으로 저명한 인공지능 연구기관 OpenAPI 의 GPT-3 을 뛰어넘는....
새로운 글로벌 AI R&D 리더쉽 by 하정우 책임리더.
공개된 기술적용 vs 자체 기술 개발.
글로벌 빅테크 기업 공개한 것 그대로 이용도 효율적일수 있으나 기술 경쟁력 한계
무한경쟁, 무한속도, ..... 글로벌리더쉽 경쟁 어렵다.
글로벌AI리더쉽 확보 매출 25% 투자. 큰비중 AI
연구 -서비스 선순환구조 : 핵심적 연구성과 나오는중.
연구 -> 엔진 -> 프로덕트-> 서비스 -> 데이터 -> 연구.
AI연구 동향 핵심 :Big(모델, 데이터, AI전문가-> 기업중심 연구 생태계)
학문적 성과... 인턴 연구원, 산학협력 생태계, 연구에서 그치는것이 아니라 직간접적 서비스 적용.
연구스팩트럼...모델 학습기법 인프라 데이터 .. 옵티마이저,
2018년 한국-일본-동남아... 등.. 글로벌AI연구생태계 구축.
서울대 AI연구원 , 카이스트 AI 대학원.
산업적 스케일에 도전적인 AI문제 해결... 글로벌 AI주도권.
네이버랩스 유로... 마티아스 갈리..
- 신뢰가능한 AI연구.... VGG(음성연구)....
대규모 한국어 이해 데이터 구축 프로젝트.
![](https://blog.kakaocdn.net/dn/css0mS/btq5Gc26VD6/C3COPkUDARajpyIdfU55H1/img.png)
AI 사람을 위한 일상의 도구 by 송대섭.
사람을 위한 일상의 도구. : 네이버의 관점.
AI 윤리준칙.
서울대AI윤리.... 함께 만듬.
1. 사람을 위한 AI 개발
2. 다양성의 존중
3. 합리적인 설명과 편리성의 조화
4. 안전을 고려한 서비스 설계
5. 프라이버시 보호와 정보보안
https://www.navercorp.com/value/aiCodeEthics
달라진 일상에서 국민의 건강과 안전을 케어하는 도구. ...
Clova Care Call : 해당지역. 접촉자 두차례 전화...
성남시 AI대신수행 십만건. 2천여명 조기발견. ...서울, 경기, 부산...
일상에서 SME (Small and medium enterprise, 중소기업) 의 사업을 도와주는 도구.
Clova AiCall.. 자연어처리-음석인식-음석합성-텍스트 분석...
클러바 램프. 문자인식, 이미지인식, 음성합성, 음석인식, 자연어 처리.
챗봇, 문자인식, 상품추천.. 문서요약.. 그림, 음성데이터...
사례 중심의 AI Report 발간. 장기적으로 Progress Report 발간...
스타트업 <-> SAPI , 스타트업 지원기관 <-> 네이버
AI 대한 고민과 경험을 사회의 자산으로...
AI Assistant
.1 대화이해 : 대화 이해 위한 컨텍스트 주입
2. 시스템 응답선택: 시멘팀 검색을 이용한 응답선택
3. 시스템 응답 생성.
![](https://blog.kakaocdn.net/dn/b38j3U/btq5JD6NokG/qXYW1KNWvWB7qvE3fN89bk/img.png)
![](https://blog.kakaocdn.net/dn/ZDXyu/btq5HMbRs5k/R8RiPZEWXJRsZhPQk6KaO1/img.png)
네이버 AI 나우
대화
페르소나 탐지기 + 캐릭터 대화체 변환기...
![](https://blog.kakaocdn.net/dn/cj324g/btq5G0api7n/M7XwIJPMFBWwoRU4eQSP20/img.png)
선지원.. 노고민 ㅋㅋㅋㅋ
지원할까해서 봤는데.. ....ㅋㅋㅋ 나에게 해당하는이야기는아닌듯. ㅎㅎㅎ
소감.. 주식을 샀다. .......
'Web' 카테고리의 다른 글
[1028 maven] 에러모음 (0) | 2021.07.02 |
---|---|
[1028web from boostcourse] 파일 시스템, 터미널 기본 (0) | 2021.06.11 |
[1028 javascript] (0) | 2021.05.06 |
[1028 intellij] (0) | 2021.05.06 |
[1028 도메인설정] 호스팅케이알 도메인/ 서브도메인/이메일 도메인 (0) | 2021.05.02 |