| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- a.x
- NLP
- Rag
- GPT-OSS
- mi:dm
- 파이썬개발
- 한국어llm
- HyperClovaX
- qwen
- llm
- llm비교
- yokohamafmarinos
- it
- 프롬프트엔지니어링
- GS아트센터 주차
- GPT
- 콘텐츠전략
- GS아트센터 a열
- 개발자생태
- re-ranker
- ecomgpt
- Python
- AI검색
- reranking
- 개발자현황
- rerank
- 딥러닝
- 리랭크
- deepseek
- gs아트센터
- Today
- Total
목록전체 글 (17)
너드한 일상
안녕하세요 티아입니다👋요즘, LLM을 공부하면 RAG라는 단어를 들어보지 않을 수 없을 정도인데요,이 RAG가 무엇인가 공부하며 제가 이해한 내용에 대해포스팅해보려 합니다. 1. RAG가 해결하는 문제 정의기본적인 LLM은 고정된 파라미터 안의 분포 정보만 사용하기 때문에,모델 파라미터 밖의 지식(사내 문서, 도메인 스키마, 최신 데이터)을 반영할 수 없고,사실 기반 응답 보장이 어렵고,업데이트하려면 재학습 또는 미세조정이 필요하다는 구조적 한계를 가진다.RAG는 이 문제를 해결하기 위해외부 지식 소스(retriever)와 LLM(generator)을 분리하여 결합하는 아키텍처다.2. RAG의 핵심 개념 (기술적으로 정확한 정의)RAG(Retrieval-Augmented Generation)는 질의..
안녕하세요, 티아입니다! 👋 딥러닝 모델이 점점 강력해지면서, 이미지 분류나 자연어 처리 같은 다양한 분야에서 놀라운 성능을 보여주고 있죠.그런데 모델이 너무 똑똑해진 탓일까요?현실 세계 데이터를 그대로 학습시키면 오히려 문제가 더 커지는 경우가 있습니다.예를 들어, 라벨에 오타가 있거나,사람이 잘못 붙인 오라벨(mislabeled sample)이 섞여 있다면,요즘 딥러닝 모델은 그걸 그냥 그대로 외워버립니다.이렇게 noisy·unclean 데이터가 섞인 환경은 실제 AI 산업 어디에나 존재합니다.그러니 “라벨이 완벽하지 않은 데이터로도 강건한 모델을 만드는 법” 은 필수 연구 주제가 됐죠. 오늘 소개할 논문은 바로 이 문제를 정면으로 다룹니다.KAIST DMLab에서 발표한 SELFIE(Self-Re..
안녕하세요 티아입니다👋2025년 8월 5일, OpenAI가 GPT-OSS라는 오픈소스 모델을 공개했는데요,최근 OpenAI가 공개한 GPT-OSS 시리즈는 단순히 오픈소스로 푼 GPT가 아닙니다.특히 20B 모델은 MMLU 기준 상위 10위권에 오르며,심지어 Gemini-2.5-Pro 바로 뒤에 위치할 정도로 놀라운 벤치마크 성능을 기록했습니다.월 200달러 구독료도, ‘호수 물’도 필요 없는,사실상 전기요금 수준(거의 무료)으로 최신 모델을 쓸 수 있다는 건 진짜 놀라운 경험이었습니다. 🧪 직접 돌려본 소감: 기대와 현실의 괴리 하지만 실제 체감은 조금 달랐습니다.강 건너기 문제(라벨만 바뀐)조차 해결하지 못하는 경우가 있었음SOTA 모델과는 여전히 큰 격차 존재심지어 일부 상황에서는 Qw..
안녕하세용 티아입니다 👋취미부자인 저의 4139897개 취미 중 하나인뮤지컬을 오랜만에 관람하고 왔습니다👏 제가 이번에 관람하고 온 위대한개츠비는 내한 공연으로,영어로 공연되는 작품이었어요!한국어 자막이 무대 좌우에 설치된 자막기를 통해 서비스되어불편하다고 느끼실 수도 있겠으나, 저는 몰입에 전혀 문제 없었어요배우들이 너~무 잘하셔서 그럴지두 결론부터 말씀드리자면, 저는 너무너무너무 추천드립니다..😂진짜 재밌게 보고 왔어요 1. 공연 정보 제가 관람하고 온 일자는 토요일 오후 2시였어용의외로 빈자리들이 조금 보이더라구요 내한 공연이라 그런가ㅠㅠ너무 재밌는데ㅠㅠ공연장 위치는 역삼역의 GS아트센터! 엘리베이터 타고 3층에 내렸을때,마주치는 로비(매표소) 모습 입니당엘리베이터..
안녕하세요 티아입니다😺2025년 7월, 한국의 ICT 기업들이 앞다투어 한국어 특화 LLM을 오픈소스로 공개했습니다. 각 모델은 크기, 성능, 경량화 정도, 활용 가능성 등에서 차별점을 가지며, 특히 경량형 모델(mini/light) 들은 로컬 활용성, 응답 속도, 비용 효율성 측면에서 주목받고 있습니다. 이번 글에서는 다음 네 모델의 경량 버전을 중심으로 비교합니다: 🟧 KT: Mi:dm 2.0 Mini🟦 SKT: A.X 4.0 Light🟩 코난테크놀로지: Konan LLM OND🟨 네이버: HyperCLOVAX SEED Think 14B (경량화 특화 구조) 📊 1. 요약 비교 테이블항목KT Mi:dm MiniSKT A.X LightKonan LLM ONDHyperCLOVAX SEE..
안녕하세요 티아입니다. 😉바야흐로 13년전,수아레즈에서부터 시작된 리버풀 팬심이폭염 경보가 뜬 7월 30일(수) 7시 30분에 요코하마의 닛산 스타디움을 다녀오게 했습니다.이것은 저의 첫 직관기록이며 차차 앞으로 더 많은 직관기를 적을 수 있길 기도합니다 🙏햐.. 7월 8월 도쿄 정말 덥더라구요인생이 힘들고 지쳐 어디든 떠나고 싶으실 때 있으시죠..?가시면 더 지쳐서 돌아오시지 못하실 수도 있으니 날이 좀 시원해지고 가시는 것을 추천합니다. 저는 챔스 우승, 준우승, 16강탈락(우승후보를 일찍만나서.)리그 우승, 1점차 준우승, 유로파 역전승,FA컵 우승 등등등모두 지켜본 13년차 콥입니다. 드디어 삶에 좀 여유가 생겨 23-24시즌 리버풀 전경기를 볼 수 있었고하필 이때 리버풀이 리그 우승을 해..
안녕하세요, 티아입니다! 👋 최근에 ChatGPT 같은 지시문 기반 대형 언어 모델(LLM)이 정말 다양한 자연어 처리(NLP) 작업에서 뛰어난 성능을 보여주고 있죠. 그런데 막상 이걸 그대로 전자상거래(E-commerce) 현장에 갖다 쓰려면 생각보다 만만치가 않습니다. 상품명, 리뷰, 스펙 같은 데이터는 일반 텍스트랑은 다르게 도메인 특화 용어도 많고 구조도 복잡해서 그렇습니다. 이번에 소개해드릴 논문은 이런 한계를 해결해보려고 세계 최초로 전자상거래 전용 대규모 지시 데이터셋(EcomInstruct)을 만들고, 그걸로 EcomGPT라는 모델까지 학습한 연구입니다. 특히 이 논문에서는 ‘Chain-of-Task’라는 개념으로 작은 단위 작업(Atomic Task)을 정의해서, 다양한 상황에서도 잘 ..
안녕하세요 티아입니다😎RAG(Retrieval‑Augmented Generation)는 벡터 검색과 대규모 언어 모델을 결합해 최신 정보에 기반한 응답을 생성하는 프레임워크입니다. 하지만 실제 서비스에서는 단순한 벡터 유사도 기반 검색만으로는 충분하지 않습니다.이번 글에서는 특히 한국어 Reranker를 도입해 검색 정확도를 어떻게 향상시킬 수 있는지를 소개합니다.🧠 Reranker란 무엇인가?Reranker는 검색된 문서 후보들을 다시 평가하여 가장 관련 있는 순서로 재정렬하는 모델입니다.왜 필요할까?벡터 검색은 빠르지만 문장 간 깊은 문맥 이해가 부족해 중요한 문서를 놓칠 수 있습니다.예를 들어, 질문 “갤럭시 S22 울트라 배터리 용량은?”에 대해 벡터 검색으로 100개 문서를 찾았을 때, 가장..