일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- llm비교
- AEO
- a.x
- NLP
- Python
- ecomgpt
- 프롬프트엔지니어링
- 한국어llm
- huggingface
- re-ranker
- AI검색
- yokohamafmarinos
- synonym
- HyperClovaX
- 마카오여행일정
- Deep Learning
- 한국어 nlp
- 파이썬개발
- it
- 개발자생태
- 콘텐츠전략
- jetbrain
- COT
- 딥러닝
- 개발자현황
- llm
- 닛산스타디움
- 소노펠리체빌리지
- mi:dm
- SageMaker
- Today
- Total
목록IT (9)
너드한 일상
안녕하세요 티아입니다😺2025년 7월, 한국의 ICT 기업들이 앞다투어 한국어 특화 LLM을 오픈소스로 공개했습니다. 각 모델은 크기, 성능, 경량화 정도, 활용 가능성 등에서 차별점을 가지며, 특히 경량형 모델(mini/light) 들은 로컬 활용성, 응답 속도, 비용 효율성 측면에서 주목받고 있습니다. 이번 글에서는 다음 네 모델의 경량 버전을 중심으로 비교합니다: 🟧 KT: Mi:dm 2.0 Mini🟦 SKT: A.X 4.0 Light🟩 코난테크놀로지: Konan LLM OND🟨 네이버: HyperCLOVAX SEED Think 14B (경량화 특화 구조) 📊 1. 요약 비교 테이블항목KT Mi:dm MiniSKT A.X LightKonan LLM ONDHyperCLOVAX SEE..

안녕하세요, 티아입니다! 👋 최근에 ChatGPT 같은 지시문 기반 대형 언어 모델(LLM)이 정말 다양한 자연어 처리(NLP) 작업에서 뛰어난 성능을 보여주고 있죠. 그런데 막상 이걸 그대로 전자상거래(E-commerce) 현장에 갖다 쓰려면 생각보다 만만치가 않습니다. 상품명, 리뷰, 스펙 같은 데이터는 일반 텍스트랑은 다르게 도메인 특화 용어도 많고 구조도 복잡해서 그렇습니다. 이번에 소개해드릴 논문은 이런 한계를 해결해보려고 세계 최초로 전자상거래 전용 대규모 지시 데이터셋(EcomInstruct)을 만들고, 그걸로 EcomGPT라는 모델까지 학습한 연구입니다. 특히 이 논문에서는 ‘Chain-of-Task’라는 개념으로 작은 단위 작업(Atomic Task)을 정의해서, 다양한 상황에서도 잘 ..
안녕하세요 티아입니다😎RAG(Retrieval‑Augmented Generation)는 벡터 검색과 대규모 언어 모델을 결합해 최신 정보에 기반한 응답을 생성하는 프레임워크입니다. 하지만 실제 서비스에서는 단순한 벡터 유사도 기반 검색만으로는 충분하지 않습니다.이번 글에서는 특히 한국어 Reranker를 도입해 검색 정확도를 어떻게 향상시킬 수 있는지를 소개합니다.🧠 Reranker란 무엇인가?Reranker는 검색된 문서 후보들을 다시 평가하여 가장 관련 있는 순서로 재정렬하는 모델입니다.왜 필요할까?벡터 검색은 빠르지만 문장 간 깊은 문맥 이해가 부족해 중요한 문서를 놓칠 수 있습니다.예를 들어, 질문 “갤럭시 S22 울트라 배터리 용량은?”에 대해 벡터 검색으로 100개 문서를 찾았을 때, 가장..
안녕하세요 티아입니다👋Python 유저라면 GIL(Global Interpreter Lock)에 따른 멀티스레딩 한계에 답답함을 느껴본 적 있으실 겁니다. "멀티스레딩이라더니, 왜 CPU 병렬 처리를 못 하죠?"라는 의문은 많은 이들의 공통된 고민이었죠.그런데, 2025년 6월 16일 Python Steering Council이 PEP 779를 공식 승인하면서 Python 3.14에서의 free-threaded(GIL 없는) 빌드는 더 이상 실험적 기능이 아닌, 공식적으로 지원되는 옵션이 되었습니다.이제 Python도 멀티코어 환경을 제대로 활용할 수 있는 시대가 열리는 걸까요?✅ PEP 779란?PEP 703(Making the Global Interpreter Lock Optional)의 연장선상이..
안녕하세요 티아입니다 😺최근 구글의 AI 검색(AI Overviews) 도입으로 "SEO(Search Engine Optimization)는 이제 끝났다"는 말이 심심치 않게 들려옵니다. 검색 결과를 요약해 보여주는 AI의 등장이, 더는 웹사이트 최적화가 무의미해졌다는 주장에 힘을 실어주는 듯합니다.하지만 이 말, 과연 사실일까요?이 질문에 대해 업계에서 ‘SEO Rockstar’라 불리는 Greg Boser는 단호하게 말합니다.“SEO는 끝난 게 아니다. 오히려, 변화하고 있을 뿐이다.”📌 AI 검색은 ‘새로운 혁명’이 아니다Greg Boser에 따르면, 지금의 AI 검색은 완전히 새로운 게 아니라, 기존 구글 기능의 연장선에 불과합니다.AI Overviews는 단지 정보 요약과 관련 링크 제공의 ..

안녕하세요, 티아입니다! 👋AI 활용, 프로그래밍 언어 트렌드, 개발자 커리어 변화까지 한눈에 정리!JetBrains가 매년 발표하는 State of Developer Ecosystem Report 2024이 공개되었습니다.이번 보고서는 전 세계 23,262명의 개발자 응답을 바탕으로, 한 페이지에 핵심 인사이트만 간결하게 정리된 것이 특징입니다.✅ 개발자 생태계의 흐름AI에 대한 두려움 감소언어 생태계의 변화해고 경험과 고용 안정성에 대한 체감개발자 경험(DX)과 생산성 측정 증가💻 가장 많이 쓰인 프로그래밍 언어는?언어비율특징JavaScript61%여전히 1위, 다만 주요 언어로 보는 비율은 감소TypeScript35%2017년 12% → 2024년 35%로 성장Python50% 이상AI/ML 분..
안녕하세요, 티아입니다! 👋오늘은 라벨링 없이도 동의어를 똑똑하게 찾아주는 그래프 기반 모델에 대해 소개해보려고 해요.검색 품질을 어떻게 개선하는지, 함께 살펴보시죠! 논문 소개이 논문은 전자상거래(e-commerce) 검색에서의 매칭 정확도를 높이기 위해 상품 설명 문서 자체를 동의어 기반으로 강화하는 방법을 제안하고 있습니다.기존의 연구가 사용자 쿼리(query)를 확장하거나 재작성하는 방식에 집중하였다면, 본 연구는 사용자 쿼리가 아닌 상품 설명 문서에 동의어를 삽입하는 방식을 채택하고 있습니다. 또한 완전한 비지도 학습(unsupervised learning) 방식으로 작동하며, 추가적인 라벨링 없이도 동의어 추출이 가능하다는 특징을 갖고 있습니다.논문의 핵심 방법론1. 후보 동의어 생성동의어 ..
안녕하세요, 티아입니다! 👋Python 개발자라면 누구나 한 번쯤은 이런 경험 있으실 거예요.pip install -r requirements.txt그리고… 기다림의 시간 ⏳잠깐 커피 한잔 마시고 오면 설치가 겨우 끝나있죠. 😅근데 이제 그런 시절은 끝났습니다.초고속 Python 패키지 매니저 **uv**가 나타났거든요!처음 써봤을 때 진심으로 "이게 진짜 돼?" 싶을 만큼 빨랐고, 너무 좋아서 여러분께 소개하려고 이 글을 씁니다.이번 글에서는 전통의 pip과 요즘 뜨는 uv를 속도, 기능, 호환성 위주로 비교해보면서,왜 이제는 uv로 갈아타야 하는지 친절하게 알려드릴게요!1. 🔍 pip vs uv 기본 개요항목pipuv개발 주체PyPA (Python Packaging Authority)Astral..