Skip to content

2024.08.14 - #4 - DeepMind table tennis robot, FLUX, CppCon, MoAI, CoLLaVO, Hydra-MDP, NPUs #6

@changh95

Description

@changh95

Interesting papers

  • Yan 2024 - An Object is Worth 64x64 Pixels: Generating 3D Object via Image Diffusion 링크
    • Diffusion을 통해서 64 x 64 크기의 '부품 이미지' (Object image)를 만든 후, 이걸 조립하면 object가 된다는 논문.
image
  • Nakkiran 2024 - Step-by-Step Diffusion: An Elementary Tutorial 링크
    • Diffusion 튜토리얼
    • AI 한글번역본 링크

Industry news

  • DeepMind의 탁구 로봇 논문링크
    • 다수의 low level 스킬 컨트롤러 + 1개의 high level 컨트롤러. High level 컨트롤러가, 어떤 스킬을 사용하면 좋을지 선택함. 각각의 low-level 스킬 컨트롤러는 modular policy architecture를 기반으로 학습됨.
    • Zero-shot sim-to-real을 통해 학습함
    • 실시간으로 처음 보는 상대의 스킬에 적응하는 능력을 갖춤
Screen.Recording.2024-08-14.at.6.46.54.PM.mov
image
  • FLUX + Runway
    • Flux로 리얼한 얼굴 생성 + Runway로 이미지를 동영상화.
    • 해외에서 1. 미디어 관련으로 쓸 게 많다, 2. 얼굴 관련 데이터셋을 만들 수 있을거라고 인기가 많음
Screen.Recording.2024-08-14.at.6.44.50.PM.mov
  • 보스턴 다이나믹스 아틀라스 푸쉬업
Screen.Recording.2024-08-14.at.6.51.40.PM.mov

Useful resources

  • Cppcon 링크
    • 로봇쪽은 C++ 코딩이 많이 사용됨.
    • C++는 굉장히 어려움... 잘 쓰기 너무너무너무 어려움...
    • Good practices를 배우기 어려움
    • 그래서 고수들이 얘기하는 C++를 보고 배우면 좋음
      • Back to basic 코스를 보고 고급 개념들만 잘 익혀도 잘 짤 수 있음
image

Metadata

Metadata

Labels

No labels
No labels

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions