1. TPU v3
3세대 프로세서(processor)는 2세대(v2)에 비해 2배 빨라짐.
pod 당 칩 개수는 4배 증가. pod 단위로 비교하면 8배(=2*4) 빨라짐.
https://en.wikipedia.org/wiki/Tensor_processing_unit
ㄴ 1년마다 버전 업?
2. Pod ? Board(X)
Board는 TPU 프로세서가 박힌 기판(1. 사진참고)
Shelf 는 사진상 하나의 층이라고 보면 될 듯
Rack 은 Shelves 의 묶음 (프레임, 전원, 쿨러 등 포함)
ㄴ V3(우)는 수냉식 채용(아래 저것은 물통인가? 펌프인가?)
Pod는 Rack 의 묶음
ㄴ 상단(v2 pod=4 Racks) 하단(Cloud TPUv3 pod=8 Racks)
이상 사진 출처 : https://www.nextplatform.com/2018/05/10/tearing-apart-googles-tpu-3-0-ai-coprocessor/
3. 가격은?
기본 | 선점형 | |
단일 TPU v2 | 4.5$/(1TPU*시간) | 1.35$/(1TPU*시간) |
단일 TPU v3(베타) | 8$/(1TPU*시간) | 2.4$/(1TPU*시간) |
TPU v2*32 | 24$/(슬라이스*시간) | |
TPU v2*512 | 384$/(슬라이스*시간) |
* 출처 : https://cloud.google.com/tpu/docs/pricing?hl=ko
* 선점형 : 문구는 더 강력할 것 같지만 반대인 건가? Cloud TPU가 다른 작업을 위해 리소스에 액세스할 경우 언제든지 종료(선점)할 수 있는 TPU. (할당량은 선점형이 더 많긴 한데...)
* VM instance 가격은 별도임.
* 1초 단위로 청구
Edge TPU
구글은 TPU 를 클라우드 뿐 아니라, 개별 단말에서도 사용할 수 있도록 유닛화하여 판매할 계획인 듯.
명칭은 엣지 TPU.
https://cloud.google.com/edge-tpu/
단말이라고 하지만 PC를 위한 것은 아닌 것 같고 IoT 기기를 위한 것으로 보임.
데이터 학습등은 cloud에서 하고, 실시간 적용은 말단에서?
Edge TPU features
This ASIC is the first step in a roadmap that will leverage Google's AI expertise to follow and reflect in hardware the rapid evolution of AI.