인라이플배 한국어 AI 언어모델 튜닝대회

한국어 자연어처리 활성화를 위해 1억개 문장으로 학습된 대형 언어모델을 공개합니다.
모델을 활용해 한국어해독 인공지능을 만들어 주세요!

대회 운영사

공식 후원사

인라이플배
한국어 AI 언어모델 튜닝대회

한국어 자연어처리 활성화를 위해 1억개 문장으로 학습된 대형 언어모델을 공개합니다. 모델을 활용해 한국어해독 인공지능을 만들어 주세요!

대회 TOP 10 랭커

“TOP7 랭커들의 최종 순위는 시상식의 10분 프리젠테이션 후 결정됩니다.”

* 시상식 7월 1일 (수) 4pm~5pm

1차 대형 언어모델 및 연습모델 공개 (05-18)

대회기간

5월 18일(월) ~ 6월 19일(금)

2차 대형 언어모델 공개

한국어 인공지능 만들기 어려웠죠 ㅜ_ㅜ

영어로 학습된 버트 대형모델들은 공개되어 있으나 한국어 버트 대형모델은 공개된 것이 없습니다.
한국어로 대형모델을 직접 학습하려면 시간과 자원이 많이 들어 개인, 중소기업은 버트 대형모델을 다루기 어렵죠.

영어로 학습된 버트 대형모델들은 공개되어 있으나 한국어 버트 대형모델은 공개된 것이 없습니다. 한국어로 대형모델을 직접 학습하려면 시간과 자원이 많이 들어 개인, 중소기업은 버트 대형모델을 다루기 어렵습니다.

.

.

.

공개합니다!

한국어 자연어 처리 활성화를 위해 인라이플과 LG CNS는 1억 문장으로 학습된
대형 언어모델을 공개하며, 모델 활성화를 위한 컴페티션을 개최합니다.

한국어 자연어 처리 활성화를 위해 인라이플과 LG CNS는 1억 문장으로 학습된 대형 언어모델을 공개하며, 모델 활성화를 위한 컴페티션을 개최합니다.

이제, 보다 쉽게 더 뛰어난 을 만드세요!

대회안내 및 참가방법

공개된 소형 모델을 통해 나만의 방법으로 미세조정하여 코쿼드에 도전하세요.

공개된 소형 모델을 통해

나만의 방법으로 미세조정하여

코쿼드에 도전하세요.

대회기간 :
5월 18일(월) ~ 6월 25일(금)

5월18일  : 1차 언어모델 공개 8,800만 학습

6월 중 : 2차 언어모델 공개 1억 학습

시상 및 발표 : 
7월 1(수) 공개 및 시상

1위 500만원 (1팀)

2위 200만원 (1팀)

3위 100만원 (3팀)

  10위까지 발표됩니다.  

심사기준 : 
비법(4), 순위(3), 소스코드(3)

비법 : 참신성, 노력, 발표내용 등고려

소스코드 : 코드 공개여부,  코드작성 수준 등 고려

* 본 대회 심사는 소형 모델에 한해 평가합니다.

대회참가 특전

5/5

모든 참여자에게 참여인증서 제공

소형모델 성능향상시 기록 인증서 제공(F1 기준)

10위 내 랭커에게 인라이플 채용 제의 또는 추천서 제공

모든 참여자에게 참여인증서 제공

소형모델 성능향상시 기록 인증서 제공

10위 내 랭커에게 인라이플 채용 제의

또는 추천서 제공

어떻게 하죠?

  1. 코랩 접속 또는 소형 모델 다운로드
  2. 나만의 방법으로 미세조정
  3. 코쿼드 (KorQuAD) 에 모델 등록
    “모델 등록 시 [AI NLP 대회 참여]를 꼭 입력.”
  4. 슬라이드쉐어에 비법 올려 공유하기

*가이드2 출처 : graykode / KorQuAD-beginner

코쿼드 (KorQuAD)란?

한국어 Machine Reading Comprehension을 위해 만든 데이터셋으로 LG CNS에서 운영하고 있습니다. 국내의 쟁쟁한 AI기관, 기업에서 참여하고 있으며 개인도 자유롭게 참여할 수 있습니다.

이번 모델을 활용하여 코쿼드에서
네이버, 카카오 등과 겨뤄보시지 않으실래요?

이번 모델을 활용하여
코쿼드에서 네이버, 카카오 등과
겨뤄보시지 않으실래요?

F.A.Q

모델공개, 활용 및 대회의 주요 질문/답변

한국어 대형모델을 왜 공개하나요?

세계적으로 다양한 BERT 대형 언어모델이 공개되어 있지만 한국어 모델은 아직 공개된 것이 없기 때문입니다. 이번 한국어 대형모델의 공개를 통해 향후 보다 뛰어난 한국어 인공지능이 나올 수 있기를 바랍니다.

대회에 참가하지 않고 모델만 사용할 수 있나요?

네, 가능합니다. 기본적으로 본 행사의 취지는 한국어 대형 언어모델을 공개하고 널리 알리는 것이 취지이기 때문에 대회참가는 부수적인 것입니다. 다만 모델을 사용해 보신다면 부담 없는 마음으로 대회에 참가하시기를 권유드립니다.

시상금 외 다른 특전이 있을까요?

기업이라면 본 대회를 통해 한국어 대형 모델을 빠르게 실험해볼 수 있는 기회가, 학생이라면 시상과 함께 인라이플 및 유수 기업에 인공지능 전문가로서 특채의 가능성이 있을 수 있습니다. 본 행사의 주관사인 인라이플 인공지능 연구소에서는 수상자를 특채로 채용할 계획을 갖고 있습니다.

소형 모델이란 무엇인가요?

공개된 대형모델의 미세조정(파인튜닝) 과정을 보다 쉽게 테스트할 수 있는 작은 모델입니다. 소형모델을 통해 공개되는 대형모델의 활용법을 보다 쉽게 파악할 수 있습니다.

슬라이드쉐어에 꼭 비법을 공개해야 하나요?

필수는 아닙니다만 간단하게 나마 모델을 활용한 비법을 공유해 주신다면 대형 언어모델 공개의 취지와도 맞고 비법을 통해 더 많은 시도들의 선순환을 기대할 수 있을것 같습니다. 만약 대회참여로 수상을 원하신다면 꼭 비법을 공유해 주시고요~

코쿼드에 모델을 등록할 때 대회참가를 어떻게 구분하나요?

코쿼드 등록을 위해 LG CNS에 모델을 메일로 모델을 전달하실 때 대회참가임을 알려주시면 됩니다.

공개된 언어모델은 쓸만한가요?

1억 이상의 문장으로 학습된 한국어 대형 언어모델은 한국어 인공지능 상용서비스에 쓰일 수 있는 수준의 충분한 성능을 갖고 있습니다. 만약 새로운 인공지능 서비스를 구상하고 계신다면 본 모델을 응용하여 시작하신다면 보다 빠른 시간에 효율적으로  개발이 가능할 것이라 생각합니다.

모델을 활용하고 싶은데 어떻게 시작해야 하죠?

모델의 사용법과 활용사례는 5월 중 온라인 웨비나와 오프라인 미니 설명회를 통해 안내될 예정입니다. 중간중간 궁금하신점이 있자면 언제든 문의센터로 연락을 주십시오.

공개된 모델로 상용서비스를 만들어도 되나요?

네, 가능합니다. 공개된 한국어 대형 언어모델로 귀사만의 상용서비스를 만드는데 어떤 제약도 없습니다. 자유롭게 더 뛰어난 한국어 인공지능 모델을 만들어 주세요.

버트 (BERT)가 뭐죠?

버트(BERT)란 구글이 인간의 언어를 더 잘 분석하고 이해하기 위해 만든 모델로 대량의 일반 지식을 학습한 후 특정한 문제에 맞게 미세조정(파인튜닝)하여 인간의 언어를 이해할 수 있도록 만든 모델입니다.

버트는 크게 일반(Base) 모델과 대형(Large) 모델로 구분할 수 있는데 규모 차이는 성능에 직결되는데 대형모델보다 좋은 성능을 낼 수 있으나 학습이 어렵고 비용이 많이 듭니다.

대회기간 중에만 모델을 KorQuAD에 출품할 수 있나요?

언제든지 본 모델을 활용한 인공지능을 KorQuAD에 출품할 수 있습니다. 이번에는 한국어 대형 언어모델의 공개를 알리는 취지에서 대회기간 중에는 특별한 시상과 프로모션이 있을 뿐이에요.  KorQuAD는 항상 열려있으며 공개된 모델의 활용도 쭈욱 자유입니다!

비법과 소스코드 공개는 어떻게 하죠?

모델 등록 후 비법(슬라이드 쉐어 또는 개인 블로그 등)과 소스코드 링크를 메일 ( ailabs@enliple.com )로 전달 주시면 됩니다. 또는 대회 종료시점에 운영측에서 메일로 관련 링크를 여쭐 계획입니다.

대회와 언어모델 공개에 대한 자유로운 내용을 남겨주세요.

페북 댓글입니다

한국어독해 AI만들기 >

모델받기는 PC를 이용해 주세요

공개된 연습용 AI모델을 다운 받아보세요

공유 : 

Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn