Sự phát triển nhanh chóng của các chủng loại Chip khả trình với mật độ tích hợp cao đã và đang có một tác động đáng kể đến sự thay đổi trong việc thiết kế các nền phần cứng của thiết bị xử lý và điều khiển nhúng trong thập kỷ gần đây. Mỗi chủng loại đều có những đặc điểm phạm vi ứng dụng và luôn không ngừng phát triển để đáp ứng một cách tốt nhất các yêu cầu ứng dụng. Bài viết này giới thiệu ngắn gọn về các chủng loại chip xử lý, điều khiển nhúng điển hình đang tồn tại, phát triển theo một số đặc trưng và hướng phạm vi ứng dụng của chúng.
Có thể thấy sự tồn tại rất đa dạng của hàng loạt các chủng loại Chip khả trình có thể sử dụng cho các bài toán thiết kế hệ nhúng. Phổ biến hiện nay là các các họ vi xử lý (VXL)/vi điều khiển (VĐK) nhúng (em-bedded micro processor/microcon-troller), Chip DSP (Digital Signal Processing), các Chip khả trình trường (FPD – Field Programmable Device). Chúng ta dễ bị lúng túng nếu bắt đầu công việc thiết kế bằng việc tìm kiếm một Chip xử lý điều khiển phù hợp cho ứng dụng. Vì vậy, cần phải có một hiểu biết và sự phân biệt nhất định về đặc điểm cấu trúc, ứng dụng của chúng khi lựa chọn cho giải pháp thiết kế. Ngoài ra các thông tin liên quan như nhà cung cấp Chip, kiến thức hiểu biết về thiết kế thực thi và công cụ phát triển hỗ trợ, giá thành… cũng là điều đáng quan tâm.
Chip P C nhúng
Đây là một chủng loại rất điển hình và đang được sử dụng rất phổ biến hiện này [3], [4]. Chúng được ra đời và ứng dụng dựa trên nền tảng của sự phát triển Chip xử lý ứng dụng cho máy tính. Vì đối tượng ứng dụng là các thiết bị nhúng nên cấu trúc cũng được thay đổi theo để đáp ứng một cách linh hoạt nhất các ứng dụng chuyên biệt. Hiện nay chúng ta có thể thấy các họ VXL/ VĐK cung cấp bởi các nhà chế tạo như, Intel, Atmel, Microchip, Motorola, Infineon... Về cấu trúc, chúng kế thừa nguyên lý các Chíp xử lý phát triển cho PC nhưng ở mức độ đơn giản hơn nhiều về công năng và tài nguyên. Phổ biến vẫn là các Chip 8 bit, 16 bit, và 32 bit. Về bản chất cấu trúc, chip vi điều khiển là chip vi xử lý được tích hợp thêm các ngoại vi. Các ngoại vi thường là các khối chức năng thông dụng như bộ định thời gian, bộ đếm, bộ chuyển đổi A/D, giao diện song song, nối tiếp… Mức độ tích hợp ngoại vi cũng đa dạng. Tuỳ thuộc vào mục đích ứng dụng sẽ có thể tìm được Chip phù hợp. Thực tế với các ứng dụng yêu cầu độ tích hợp cao sẽ sử dụng giải pháp tích hợp trên Chip. Tuy nhiên, hầu hết các Chip đều cung cấp giải pháp để mở rộng ngoại vi đáp ứng một cách linh hoạt và mềm dẻo cho các ứng dụng cụ thể.
Hình 1: Kiến trúc điển hình của VĐK
Chip DSP
DSP vẫn được biết tới như một loại vi điều khiển đặc chủng với khả năng xử lý nhanh để phục vụ các bài toán yêu cầu khối lượng và tốc độ xử lý tính toán lớn. Với ưu điểm nổi bật về độ rộng băng thông của bus và thanh ghi tích luỹ, cho phép ALU xử lý song song với tốc độ đọc và xử lý lệnh nhanh hơn các loại vi điều khiển thông thường. Chip DSP lại cho phép thực hiện nhiều lệnh trong một nhịp nhờ vào kiến trúc bộ nhớ Havard với băng thông rộng [2].
Thông thường khi phải sử dụng DSP tức là để đáp ứng các bài toán tính toán lớn và tốc độ cao vì vậy định dạng biểu diễn toán học sẽ là một yếu tố quan trọng để phân loại và được quan tâm. Hiện nay chủ yếu chúng vẫn được phân loại theo hai kiểu là dấu phảy động (floating-point) và dấu phảy tĩnh (fixed-point). Đây cũng chính là một yếu tố quan trọng phải quan tâm đối với người thiết kế để lựa chọn được một DSP phù hợp với ứng dụng của mình. Các loại DSP dấu phảy tĩnh thường là loại 16-bit hoặc 24-bit còn các loại dấu phảy động thường là 32-bit. Một ví dụ điển hình về DSP 16-bit dấu phảy tĩnh là TMS320C55x [2], biểu diễn và xử lý các số nguyên 16 bit hoặc các số thực trong một miền giá trị cố định. Tuy nhiên, các giá trị và dữ liệu trung gian có thể được lưu trữ với độ chính xác là 32-bit trong thanh ghi tích luỹ 40-bit nhằm giảm thiểu lỗi tính toán do phép làm tròn trong quá trình tính toán. Thông thường các loại DSP dấu phảy tĩnh có giá thành rẻ hơn các loại DSP dấu phảy động vì yêu cầu số lượng chân tích hợp on-chip ít hơn, cần sử dụng lượng silicon ít hơn.
Hình 2: Cấu trúc điển hình của PAL
Ưu điểm nổi bật của các DSP dấu phảy động là có thể xử lý, biểu diễn số trong dải phạm vi giá trị rộng và động. Do đó vấn đề về chuyển đổi và hạn chế về phạm vi biểu diễn số không phải quan tâm như đối với loại DSP dấu phảy tĩnh. Một loại DSP 32-bit dấu phảy động điển hình là TMS320C67x có thể xử lý và biểu diễn số gồm 24-bit mantissa và 8-bit exponent. Phần mantissa biểu diễn phần số lẻ trong phạm vi -1.0 +1.0 và phần exponent biểu diễn vị trí của dấu phảy nhị phân, có thể dịch chuyển sang trái hoặc phải tuỳ theo giá trị số mà nó biểu diễn. Điều này thể hiện ưu điểm nổi bật hơn hẳn so với các thiết kế trên nền DSP dấu phảy tĩnh. Người phát triển chương trình phải tự qui ước, tính toán và phân chia ấn định thang biểu diễn số, phải luôn lưu tâm tới khả năng tràn số có thể xảy ra trong quá trình xử lý tính toán. Chính điều này đã gây ra khó khăn không nhỏ đối với người lập trình. Nói chung phát triển chương trình cho DSP dấu phảy động thường đơn giản hơn nhưng giá thành lại cao hơn nhiều và năng lượng tiêu thụ thông thường cũng lớn hơn.
Chip khả trình mảng PLD
Ngày nay khi nói đến các chủng loại Chip khả trình mảng ta thường biết tới một số tên gọi như PAL, CPLD, FPGA… Một chút vắn tắt về sự phát triển sẽ giúp chúng ta hình dung được đặc điểm và nguồn gốc ra đời của chúng.
Hình 3: Cấu trúc nguyên lý của FPGA
Lịch sử phát triển của các chủng loại Chip khả trình mảng PLA được bắt nguồn từ nguyên lý bộ nhớ chương trình PROM (Programmable Read-Only Memory). Trong đó các đầu vào địa chỉ đóng vai trò như các đường vào của mạch logic và các đường dữ liệu ra đóng vai trò như các đường ra của mạch logic. Nó rất phù hợp để thực hiện mạch logic có dạng tổng các tích (vì cấu thành bởi các phần tử logic AND và OR). Nhưng nhược điểm là chi phí sản xuất cao và tốc độ hoạt động thấp. Để khắc phục nhược điểm này PAL (Programmable Array Logic) đã được phát triển. Nó được cấu thành từ các phần tử AND khả trình và phần tử OR gán cố định, có chứa cả phần tử flip-flop ở đầu ra nên có khả năng thực thi các mạch logic tuần tự. Hình 2 mô tả cấu trúc chung của PAL.
Từ khi được ra đời và phát triển, PAL trở thành cơ sở cho sự ra đời của hàng loạt các chủng loại Chip khả trình mảng với cấu trúc phức tạp hơn như SPLD (Simple Programmable Logic Device), CPLD (Complex Programmable Logic Device), và FPGA (Field Programmable Gate Array). Sau này, SPLD cũng là tên gọi cho nhóm các chủng loại Chip kiểu tương tự như PAL, PLA. Về mặt cấu trúc thì SPLD cho phép tích hợp các phần tử logic với mật độ cao hơn so với PAL thông thường nhưng kích thước của nó sẽ tăng lên rất nhanh nếu tiếp tục mở rộng và tăng mật độ tích hợp số đầu vào. Để đáp ứng nhu cầu mở rộng mật độ tích hợp, CPLD đã được phát triển. Nó là sự tích hợp của nhiều khối SPLD và cung cấp thêm khả năng kết nối khả trình giữa các khối SPLD đơn lẻ với nhau. Với nguyên lý cấu trúc này CPLD có khả năng tích hợp với mật độ cao tương đương với 50 khối SPLD thông thường [1].
Nếu chỉ dừng đến đây chúng ta có thể thấy một đặc điểm chung của các chủng loại chip kiều PLA hay CPLD đều cho phép thực hiện các mạch logic trên cơ sở tổ hợp logic của các đầu vào và ra bằng các phần tử AND và OR. Với nguyên lý này rõ ràng sẽ gặp khó khăn khi thực thi các ứng dụng đòi hỏi các phép tính toán logic phức tạp với tốc độ cao. Để đáp ứng điều này FPGA (Field Programmable Gate Arrays) đã ra đời. Nó là sự cấu thành của các khối logic khả trình và các kênh kết nối liên thông khả trình giữa các khối đó với nhau. Một hình ảnh tiêu biểu về cấu trúc nguyên lý của FPGA được mô tả như trong Hình 3.
FPGA - đang trở thành một sự lựa chọn thay thế rất cạnh tranh của các chip xử lý nhúng khả trình mảng. Nó hỗ trợ các ưu điểm về chức năng lựa chọn giống như ASICS nhưng cho phép chỉnh sửa và thiết kế lại sau khi sử dụng, giá thành phát triển thấp hơn. FPGA cho phép khả năng thiết kế linh hoạt và thích nghi dễ dàng cho các tiện ích thiết bị, trong khi vẫn duy trì được không gian kích thước phần cứng và năng lượng tiêu thụ của hệ thống. Điều này không dễ dàng nhận được khi thiết kế dựa trên nền các Chip C/ DSP.
FPGA thực sự phù hợp cho các ứng dụng đòi hỏi lượng tính toán lớn như trong xử lý tín hiệu. Nó có thể được lập trình hoạt động đồng thời với một số các đường dữ liệu song song. Chúng là các đường dữ liệu hoạt động của tổ hợp cứng của nhiều chức năng từ đơn giản đến phức tạp như bộ cộng, bộ nhân, bộ đếm, bộ lưu trữ, bộ so sánh, bộ tương quan, …
Ngày nay có thể phân loại ra một số kiểu chủng loại FPGA dựa vào cấu tạo của chúng:
Hình 4: Cấu trúc CLB
■ Cấu tạo từ SRAM
Với loại này các mắt kết nối khả trình được thực hiện bằng các phần tử SRAM, chính vì vậy cho phép thực hiện lập trình lặp lại nhiều lần. Ưu điểm nổi bật của loại này là các ý tưởng thiết kế mới có thể được thực thi và thử nghiệm nhanh chóng. Hơn nữa SRAM cũng đang là một hướng phát triển rất mạnh hiện nay trong nền công nghiệp sản xuất bộ nhớ và cũng đều thực thi theo công nghệ CMOS rất phù hợp với công nghệ chế tạo ra FPGA.
Tuy nhiên, một đặc điểm có thể xem như là nhược điểm của FPGA cấu tạo từ các phần tử SRAM là chúng phải cấu hình lại mỗi khi nguồn hệ thống được cung cấp. Công việc này thường được thực hiện bởi một bộ nhớ ngoài chuyên dụng hoặc bởi một bộ vi điều khiển kèm theo mạch. Chính vì vậy cũng làm giá thành của FPGA tăng thêm.
■ Cấu tạo từ anti-fused
Không giống như loại FPGA cấu tạo từ SRAM, FPGA với cấu tử kết nối kiểu cầu chì được lập trình offline bằng một thiết bị lập trình chuyên dụng. Ý tưởng chế tạo loại FPGA này xuất phát từ nhu cầu về một thiết bị khả trình có khả năng lưu cấu hình sau khi được sử dụng. Tức là nó không phải làm công việc cấu hình mỗi khi nguồn hệ thống được cung cấp. Khi FPGA anti-fused đã được lập trình thì nó không thể bị thay đổi hay được lập trình lại nữa. Chính nhờ điều này nên nó không cần bất kỳ một bộ nhớ ngoài nào để lưu trữ cấu hình và có thể tiết kiệm, giảm giá thành của thiết bị.
Một ưu điểm nổi bật của FPGA anti-fused là kiểu cấu trúc liên kết khá bền vững với các loại nhiễu bức xạ. Đặc điểm này khá quan trọng khi thiết bị phải làm việc trong môi trường nhiễu tiềm năng như công nghiệp năng lượng, quân sự hoặc hàng không vũ trụ... Vì vậy nó tránh được trường hợp rủi ro có thể xảy ra nếu sử dụng công nghệ SRAM là hiện tượng lật trạng thái (flipped). Tuy nhiên, hiện tượng này cũng có thể được khắc phục bằng cơ chế dự phòng chập 3 nhưng lại làm tăng thêm chi phí chế tạo.
Một ưu điểm nổi bật của loại FPGA anti-fused là khả năng bảo mật công nghệ. Tức là dữ liệu cấu hình lập trình cho FPGA có thể được bảo vệ bởi việc đọc bất hợp pháp hoặc không cho phép đọc. Trong quá trình xử lý hoặc phát triển, người lập trình sẽ sử dụng một tệp dữ liệu cấu hình để lập trình và kiểm tra quá trình nạp cấu hình cho FPGA. Công việc này chỉ thực hiện một lần và sẽ không thể thay đổi được nữa. Khi thực hiện xong nó có thể được thiết lập thêm một thuộc tính là chống đọc trực tiếp dữ liệu liên quan đến cấu hình. Ngoài ra chúng ta cũng có thể thấy thêm rằng FPGA antifused thường sử dụng ít năng lượng hơn loại FPGA SRAM, kích thước cũng nhỏ hơn, và tốc độ cũng nhanh hơn một chút nhờ khoảng cách kết nối cứng giữa các phần tử ngắn hơn.
Nhược điểm lớn nhất của FPGA anti-fused là chỉ có thể được lập trình và cấu hình một lần. Vì vậy nó chỉ thực sự phù hợp khi thực thi hoàn chỉnh sản phẩm cuối cùng và không phù hợp với mục đích thiết kế phát triển.
■ Cấu tạo từ EEPROM/FLASH
EEPROM or FLASH-based FPGAs cũng có nguyên lý cấu tạo tương tự như loại FPGA-SRAM. Các phần tử cấu hình của nó được kết nối dựa trên một chuỗi thanh ghi dịch dài. Chúng có thể được cấu hình offline bằng các thiết bị lập trình chuyên dụng. Cũng có một số có thể lập trình online nhưng thời gian lập trình cấu hình sẽ gấp khoảng 3 lần thời gian thực thi với nền FPGA-SRAM. Khi đã được cấu hình hay được lập trình thì chúng có thể được duy trì và không bị mất đi như nguyên lý lưu giữ của EEPROM hoặc FLASH. Loại FPGA-EEPROM/FLASH có cấu tạo nhỏ hơn so với loại FPGA-SRAM vì vậy cũng có thể giảm được thời gian lan truyền tín hiệu kết nối liên thông giữa các phần tử logic.
Để bảo vệ công nghệ khi FPGA đã được cấu hình và đưa ra sử dụng, ta có thể bảo vệ bằng cơ chế khóa mã mềm (cấu tạo từ khoảng 50 bit đến vài trăm bit). Muốn đọc được thông tín cấu hình trực tiếp từ FPGA, người ta cần phải có mã khóa đó và cũng rất khó hoặc không thể tìm được theo nguyên lý thử sai. Vì vậy, theo ước tính cũng phải mất đến hàng triệu năm mới hy vọng thành công để tìm ra được.
Tuy nhiên, công nghệ chế tạo FPGA-EEPROM/FLASH đòi hòi thực thi qua nhiều công đoạn xử lý hơn so với loại FPGA-SRAM, vì vậy sự phát triển của chúng cũng chậm hơn. Hơn nữa năng lượng tiêu thụ của chúng cũng lớn hơn vì phải nuôi rất nhiều các phần tử điện trở kéo (pull-up resistor).
Hình 5: Khối Logic dạng MUX
■ Cấu tạo từ tổ hợp FLASH-SRAM
Ngày nay người ta cũng phát triển chế tạo các loại FPGA cấu tạo từ các tổ hợp SRAM và FLASH để tận dụng được các ưu điểm của cả hai chủng loại này. Thông thường các phần tử cấu hình FLASH sẽ được sử dụng để lưu các nội dung cấu hình để sao chép cho các phần tử cấu hình SRAM. Và các phần tử cấu hình SRAM hoàn toàn có thể được cấu hình lại theo yêu cầu thiết kế trong khi vẫn duy trì một phần thiết kế cấu hình gốc lưu trong các phần tử FLASH.
Người ta cũng thường phân loại FPGA dựa vào phần tử kiến trúc của chúng và bao gồm 3 loại chính: mịn, thô và trung bình. Bản chất việc phân loại này là dựa vào kiểu khối logic khả trình cấu thành nên FPGA. Với loại FPGA mịn thì kiến trúc các khối logic khả trình thường là các cổng logic đơn giản (kiểu AND, OR…, các phần tử lưu giữ như Triger-D…). Kiểu kiến trúc này phù hợp và thường sử dụng hiệu quả với kiến trúc ASICS. Gần đây xu thế phát triển của FPGA đang tập trung vào loại kiến trúc thô. Tức là các khối logic khả trình là các khối có khả năng xử lý logic lớn với nhiều tổ hợp liên kết, phức tạp với nhiều đầu vào/ra liên kết. Tuỳ theo mức độ của khối logic khả trình đó mà người ta phân ra thành các loại trung bình.
Có hai loại cấu trúc cơ bản cấu thành nên các khối logic khả trình trong kiến trúc FPGA thô hoặc trung bình là MUX (Multiplexer) và LUT (Lookup Table). Trong loại cấu trúc MUX thì các phần tử logic được cấu thành theo cấu trúc tổ hợp các đầu vào ra theo nguyên lý MUX như mô tả trong Hình 5.
Đối với loại cấu trúc LUT thì các đầu vào thực chất là các tổ hợp để chọn ra giá trị trong bảng chân lý của hàm chức năng cần thực thi. Nguyên lý của loại khối logic này được mô tả như trong Hình 6.
Hầu hết các ứng dụng đều có nhu cầu về bộ nhớ RAM on Chip vì vậy một số dòng FPGA hiện nay cũng tích hợp thêm cả các phần tử nhớ RAM, được gọi là RAM nhúng (embedded RAM). Các phần tử RAM đó được tổ chức thành từng khối và tuỳ thuộc vào kiến trúc của FPGA nó sẽ được phân bố linh hoạt, thường là xung quanh các phần tử ngoại vi hoặc phân bố đều trên bề mặt Chip.
Hình 6: Khối Logic dạng LUT
■ FPGA tổ hợp lai
FPGA với hạt nhân là C/DSP: Thực chất đó là một tổ hợp nhằm tăng tốc và khả năng tính toán. Khái niệm này cũng tương tự như các bộ đồng xử lý toán học trong kiến trúc máy tính. Nguyên lý là nhằm san sẻ và giảm bớt tải sang FPGA để thực thi các chức năng tính toán lớn (thông thường đòi hỏi thực hiện trong nhiều nhịp hoạt động của Chip DSP), cho phép Chip DSP tập trung thực hiện các chức năng đơn nhịp tối ưu. Tổ hợp FPGA và DSP là một kiến trúc rất linh hoạt, đặc biệt cải thiện được hiệu suất thực hiện, tăng tốc hơn rất nhiều so với kiến trúc nhiều Chip DSP hoặc ASICS đồng thời giá thành lại thấp hơn.
Sự phát triển của các Chip xử lý ngày càng hoàn thiện, cải thiện rút ngắn đáng kể thời gian thực thi và giá thành. Căn cứ vào yêu cầu ứng dụng cụ thể người thiết kế sẽ phải quyết định giải pháp thực thi trên cơ sở về điều kiện và kiến thức về giải pháp thiết kế. Với các ứng dụng thông thường và đơn giản có thể thực thi dựa trên các vi điều khiển và vi xử lý truyền thống. Tuy nhiên với các ứng dụng yêu cầu về tốc độ và mức độ xử lý lớn sự lựa chọn sẽ phải cân nhắc tới DSP hoặc thực thi trực tiếp dựa trên các nền Chíp khả trình mảng. Trong thời gian tới với tốc độ phát triển không ngừng giá thành và công cụ thực thi sẽ được cải thiện góp phần không nhỏ đến sự lựa chọn giải pháp thiết kế. Hứa hẹn sẽ có tác động đáng kể đến sự phát triển các thiết bị xử lý và điều khiển nhúng nói chung đặc biệt là sự tham gia của các chíp khả trình mảng.
Tài liệu tham khảo
[1] Clive Maxfiled, “The Design Warrior’s Guide to FPGA”, New-nes, 2004.
[2] www.ti.com
[3] www.microchip.com
[4] www.atmel.com
[5] www.xilinx.com
[6] www.altera.com
Theo Tự động hóa ngày nay