Tin tức

Bộ tăng tốc mạng thần kinh cho Lattice FPGAs

Cả hai đều nhằm mục đích thực hiện các mạng thần kinh trong các sản phẩm cạnh tranh của người tiêu dùng và công nghiệp. Chúng không thích hợp cho việc đào tạo mạng, mà phải được thực hiện ở nơi khác.

“Bộ tăng tốc mạng thần kinh (BNN) được hỗ trợ có trọng lượng 1 bit, có khối lượng kích hoạt 1bit và được thiết kế để sử dụng với các FPGA iCE40 UltraPlus của công ty.

Sự kết hợp của máy gia tốc và FPGA được thiết kế cho các ứng dụng luôn bật như phát hiện cụm từ chính, phát hiện khuôn mặt và phát hiện đối tượng.

Lattice-BNN-acceleratorCác thông số ứng dụng BNN + iCE40 UltraPlus được dự đoán là:

  • 1bit mạng thần kinh
  • Tiêu thụ hoạt động 1-10mW
  • Dấu chân 5.5mm2
  • ~ $ 1 bom

Sản phẩm thứ hai, "bộ tăng tốc mạng thần kinh xoắn ốc" (CNN), hỗ trợ lựa chọn dữ liệu 1, 8 và 16bit cho cả trọng lượng và kích hoạt, nhằm vào các FPGA ECP5 - thường được dùng để sử dụng video.

Để tiết kiệm tài nguyên FPGA, độ rộng từ khác nhau (1, 8 hoặc 16bit) có thể được trộn lẫn và khớp với nhau trong các lớp khác nhau của mạng thần kinh.

Sự kết hợp của máy gia tốc và FPGA được thiết kế cho các ứng dụng bao gồm theo dõi khuôn mặt, theo dõi đối tượng, phát hiện dấu hiệu tốc độ và đếm đối tượng.

Lattice-CNN-accelerator

Các thông số ứng dụng CNN + ECP5 được dự đoán là:

  • Mạng 1, 8 hoặc 16bit
  • <1W active consumption
  • Dấu chân 100mm2
  • ~ $ 10 bom

Đối với phát triển phần mềm, công ty đang giới thiệu một trình biên dịch mạng nơron tương thích với cả hệ thống phát triển mạng của Caffe và TensorFlow.

Theo giám đốc tiếp thị của Lattice, Deepak Boppana, trình biên dịch yêu cầu không có kinh nghiệm RTL trước đó, và cũng sẽ phân tích và mô phỏng thiết kế.

Kế hoạch là, Boppana cho biết, trình biên dịch sẽ được sử dụng cùng với môi trường phát triển Radiant của công ty cho sự kết hợp BNN + iCE40 UltraPlus, hoặc môi trường phát triển Diamond của nó cho CNN + EC5P.

Đối với khách hàng không chắc chắn làm thế nào để phát triển một ứng dụng dựa trên mạng thần kinh, công ty đã hợp tác với các công ty dịch vụ thiết kế bao gồm Colorado Engineering, Wipro, Softnautincs và VectorBlox.

Ban phát triển phần cứng đã có sẵn cho iCE40 UltraPlus và ECP5.

Giao diện cầu nối và ứng dụng tập hợp dữ liệu được mong đợi trong các ứng dụng IoT có khối lượng cao bao gồm loa thông minh, camera giám sát, rô bốt công nghiệp và máy bay không người lái.

Thiết kế tham khảo đang được cung cấp cho: phát hiện khuôn mặt, phát hiện cụm từ khóa (iCE40 UltraPlus) và cho EC5P: đếm đối tượng, theo dõi khuôn mặt và phát hiện dấu hiệu tốc độ.

Các máy gia tốc có thương hiệu ‘sensAI‘.