-
Notifications
You must be signed in to change notification settings - Fork 3
Open
Description
NVIDIA NIM (Neural inference microservices?)
개인 GPU 없이, 최신 NVIDIA 모델 및 LLM 모델들을 돌려보세요! NVIDIA 엔지니어가 최적화도 다 해놔서 속도도 HuggingFace보다 훨씬 빠릅니다.
https://build.nvidia.com/explore/discover
Physical AI
cosmos-nemotron-34b (�Video summarization, Video captioning)
- "Elaborate what the worker is doing, why he would be taking this action and also provide information on what he is wearing."
- "How many people are in this video?" (틀림...)

cosmos-1.0-diffusion-7b (Text-to-world, Image-to-world 동영상 생성)
- "A first person view from the perspective from a dog sized robot as it works in a car manufacturing site. The robot has many unfinished cars and engine components nearby. The camera on moving forward. Photorealistic"
- "A first person view from the perspective from a quadrupled robot as it works in a car manufacturing site. The robot has many unfinished cars and engine components nearby. The camera on moving forward. Photorealistic"
cosmos-1.0-autoregressive-5b (Video-to-world, Image-to-world 동영상 생성. 짧은 동영상을 길게 만들기)
API list
- 서버 없이 LLM을 돌려보기 딱 좋음
- 기본적으로 NVIDIA 아키텍처에서 필요한 모든 가속이 들어가있음.
- 엔비디아 엔지니어들에게 들어보니, 이걸 전부 다 손으로 만든다고 😭

- Qwen2.5-coder:32b-Instruct
Blueprints

Price
- 개발자 프로그램 참여하면 무료로 API 무제한 사용 된다고 들었던거 같은데... 확인 필요
- 스타트업이라면 NVIDIA Inception 프로그램 참가하면 API 크레딧 엄청 많이 준다고 알고있음.

LLM
한국말 잘하는 LLM
챗봇 만들때 굿
- 마이크로소프트 Phi4 (14B)
- 알리바바 Qwen 2.5 (7B, 14B, 32B, 70B)
- 구글 Gemma2 (9B, 27B)
코딩할 때 좋은 LLM
- DeepSeek DeepSeek-R1-distilled-Qwen2.5 (32B) 아키텍처 용으로 최고.
- 알리바바 Qwen 2.5-coder (32B 이상)
- 마이크로소프트 Phi4 (14B) 범용성 최고
- Llama 3.2 (3B) - auto-complete용 모델로 속도 빠름
DeepSeek-R1
- OpenAI o1 급 성능?
- MIT 라이센스 (상업적 사용 가능)
- 성능 굿 👍👍
- QwQ 보다 좋음.
- 질문 제대로 안하면 무한루프에 빠져들음
- 이전 채팅 기록에 이어서 질문하는거 잘 안됨
- 태그 필터링 필요
- 알고리즘/자료구조 문제 기가막히게 잘풀음
- 중국 역사 질문 피함
Metadata
Metadata
Assignees
Labels
No labels