본문 바로가기

딥시크1

딥시크 알아보기 딥시크(DeepSeek)는 최근 등장한 AI 모델로, 특히 강화학습(Reinforcement Learning)만을 활용해 학습된다는 점에서 주목받고 있습니다. 딥시크는 기존 대규모 언어 모델(LLM)들이 주로 의존했던 지도학습(Supervised Learning)이나 인간 피드백 기반 강화학습(RLHF)과는 다른 접근 방식을 택해, 최소한의 데이터와 자원으로도 강력한 성능을 낼 수 있다는 점에서 기술적 혁신을 이뤘다는 평가를 받고 있습니다.---딥시크의 핵심 특징1. 순수 강화학습 기반 학습딥시크는 기존 LLM들이 사용하는 대규모 텍스트 데이터 사전 학습 없이, 강화학습만으로 학습됩니다.알파고 제로 방식과 유사알파고 제로(AlphaGo Zero)처럼 초기 데이터 없이 모델 스스로 학습하고 성능을 개선합니.. 2025. 1. 27.

이전 1 다음

티스토리툴바