| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- 콘텐츠전략
- reranking
- GS아트센터 주차
- NLP
- ecomgpt
- Rag
- mi:dm
- llm비교
- a.x
- 리랭크
- deepseek
- 파이썬개발
- 딥러닝
- yokohamafmarinos
- GPT-OSS
- 한국어llm
- HyperClovaX
- GPT
- 개발자현황
- gs아트센터
- qwen
- Python
- 프롬프트엔지니어링
- rerank
- GS아트센터 a열
- it
- re-ranker
- llm
- 개발자생태
- AI검색
- Today
- Total
목록2025/12 (2)
너드한 일상
안녕하세요 티아입니다👋요즘, LLM을 공부하면 RAG라는 단어를 들어보지 않을 수 없을 정도인데요,이 RAG가 무엇인가 공부하며 제가 이해한 내용에 대해포스팅해보려 합니다. 1. RAG가 해결하는 문제 정의기본적인 LLM은 고정된 파라미터 안의 분포 정보만 사용하기 때문에,모델 파라미터 밖의 지식(사내 문서, 도메인 스키마, 최신 데이터)을 반영할 수 없고,사실 기반 응답 보장이 어렵고,업데이트하려면 재학습 또는 미세조정이 필요하다는 구조적 한계를 가진다.RAG는 이 문제를 해결하기 위해외부 지식 소스(retriever)와 LLM(generator)을 분리하여 결합하는 아키텍처다.2. RAG의 핵심 개념 (기술적으로 정확한 정의)RAG(Retrieval-Augmented Generation)는 질의..
안녕하세요, 티아입니다! 👋 딥러닝 모델이 점점 강력해지면서, 이미지 분류나 자연어 처리 같은 다양한 분야에서 놀라운 성능을 보여주고 있죠.그런데 모델이 너무 똑똑해진 탓일까요?현실 세계 데이터를 그대로 학습시키면 오히려 문제가 더 커지는 경우가 있습니다.예를 들어, 라벨에 오타가 있거나,사람이 잘못 붙인 오라벨(mislabeled sample)이 섞여 있다면,요즘 딥러닝 모델은 그걸 그냥 그대로 외워버립니다.이렇게 noisy·unclean 데이터가 섞인 환경은 실제 AI 산업 어디에나 존재합니다.그러니 “라벨이 완벽하지 않은 데이터로도 강건한 모델을 만드는 법” 은 필수 연구 주제가 됐죠. 오늘 소개할 논문은 바로 이 문제를 정면으로 다룹니다.KAIST DMLab에서 발표한 SELFIE(Self-Re..