일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- GPT-OSS
- SageMaker
- 마카오여행일정
- mi:dm
- a.x
- llm
- 한국어llm
- 프롬프트엔지니어링
- qwen
- huggingface
- NLP
- yokohamafmarinos
- GS아트센터 주차
- HyperClovaX
- GS아트센터 a열
- 딥러닝
- it
- GPT
- re-ranker
- llm비교
- 파이썬개발
- gs아트센터
- Python
- deepseek
- AI검색
- ecomgpt
- 개발자생태
- 한국어 nlp
- 개발자현황
- 콘텐츠전략
- Today
- Total
목록GPT (2)
너드한 일상
안녕하세요 티아입니다👋2025년 8월 5일, OpenAI가 GPT-OSS라는 오픈소스 모델을 공개했는데요,최근 OpenAI가 공개한 GPT-OSS 시리즈는 단순히 오픈소스로 푼 GPT가 아닙니다.특히 20B 모델은 MMLU 기준 상위 10위권에 오르며,심지어 Gemini-2.5-Pro 바로 뒤에 위치할 정도로 놀라운 벤치마크 성능을 기록했습니다.월 200달러 구독료도, ‘호수 물’도 필요 없는,사실상 전기요금 수준(거의 무료)으로 최신 모델을 쓸 수 있다는 건 진짜 놀라운 경험이었습니다. 🧪 직접 돌려본 소감: 기대와 현실의 괴리 하지만 실제 체감은 조금 달랐습니다.강 건너기 문제(라벨만 바뀐)조차 해결하지 못하는 경우가 있었음SOTA 모델과는 여전히 큰 격차 존재심지어 일부 상황에서는 Qw..

안녕하세요, 티아입니다! 👋 최근에 ChatGPT 같은 지시문 기반 대형 언어 모델(LLM)이 정말 다양한 자연어 처리(NLP) 작업에서 뛰어난 성능을 보여주고 있죠. 그런데 막상 이걸 그대로 전자상거래(E-commerce) 현장에 갖다 쓰려면 생각보다 만만치가 않습니다. 상품명, 리뷰, 스펙 같은 데이터는 일반 텍스트랑은 다르게 도메인 특화 용어도 많고 구조도 복잡해서 그렇습니다. 이번에 소개해드릴 논문은 이런 한계를 해결해보려고 세계 최초로 전자상거래 전용 대규모 지시 데이터셋(EcomInstruct)을 만들고, 그걸로 EcomGPT라는 모델까지 학습한 연구입니다. 특히 이 논문에서는 ‘Chain-of-Task’라는 개념으로 작은 단위 작업(Atomic Task)을 정의해서, 다양한 상황에서도 잘 ..