Hệ thống nhận dạng giọng nói và hoạt động của nó

Hãy Thử Công Cụ CủA Chúng Tôi Để LoạI Bỏ Các VấN Đề





Các hệ thống nhận dạng giọng nói là khả năng của một thiết bị hoặc chương trình để nhận và hiểu chính tả, hoặc hiểu một lệnh nói. Khi hệ thống này được sử dụng với máy tính, tín hiệu tương tự phải được chuyển đổi thành kỹ thuật số bằng ADC . Trong máy tính, cần có cơ sở dữ liệu kỹ thuật số, âm tiết và từ vựng của các từ và âm tiết để giải mã tín hiệu. Các dạng của bài phát biểu được lưu trữ trong ổ cứng và được tải vào bộ nhớ khi chương trình được chạy. Các biểu mẫu được lưu trữ được máy tính kiểm tra dựa trên o / p của bộ chuyển đổi tương tự sang kỹ thuật số. Tất cả các loại hệ thống nhận dạng giọng nói đều không tạo ra đầu ra chính xác. Bởi vì, tiếng chó sủa, tiếng la hét của trẻ em và âm thanh bên ngoài lớn có thể tạo ra i / p sai.

Những loại giọng nói này chỉ có thể được nhận dạng bằng cách sử dụng hệ thống nhận dạng giọng nói trong phòng yên tĩnh. Cũng có một số vấn đề với một số từ tạo ra âm thanh tương tự như đây & nghe. Để khắc phục vấn đề này, hệ thống này yêu cầu bộ vi xử lý nhanh hơn và RAM có sẵn trong máy tính cá nhân. Tuy nhiên, các hệ thống này đã có sẵn trên thị trường và các công ty dẫn đầu ngành của hệ thống nhận dạng giọng nói là Dragon system và IBM.




Hệ thống bảo mật nhận dạng giọng nói

Hệ thống bảo mật nhận dạng giọng nói

Hệ thống bảo mật nhận dạng giọng nói

Ý tưởng chính của dự án này là thiết kế nhận dạng giọng nói hệ thống an ninh . Dự án này chủ yếu được sử dụng cho mục đích bảo mật để xác định mật khẩu thoại từ người được ủy quyền và hệ thống sẽ mở khi mật khẩu chính xác. Hệ thống này sẽ được kiểm soát bởi Bộ vi điều khiển PIC có thể được lập trình bằng hợp ngữ hoặc ngôn ngữ C.



Phân loại hệ thống nhận dạng giọng nói

Hệ thống nhận dạng giọng nói được phân thành bốn loại như VRS cô lập, VRS liên tục, VRS phụ thuộc vào loa và VRS độc lập với loa.

Phân loại hệ thống nhận dạng giọng nói

Phân loại hệ thống nhận dạng giọng nói

  • VRS biệt lập yêu cầu một đoạn ngắn qua các từ đã nói
  • VRS liên tục không yêu cầu một đoạn ngắn qua các từ đã nói
  • VRS phụ thuộc vào loa xác định giọng nói chỉ từ một người nói
  • VRS độc lập với loa xác định bài phát biểu của bất kỳ ai.

Thiết kế phần cứng của Hệ thống bảo mật nhận dạng giọng nói

Dự án Hệ thống bảo mật nhận dạng giọng nói này được thiết kế với ba yếu tố chính như mạch micrô, vi điều khiển và Màn hình LCD Việc thiết kế dự án hệ thống an ninh nhận dạng giọng nói này rất dễ dàng. Mạch micrô được kết nối với mạch tương tự sang kỹ thuật số của vi điều khiển PIC. Từ kỹ thuật số đi qua các bộ lọc kỹ thuật số. Quá trình này được thực hiện trên bộ vi điều khiển, khi quá trình được thực hiện, màn hình LCD được kết nối với bộ vi điều khiển để hiển thị lời nói có khớp với mật khẩu có sẵn hay không.

Mô-đun nhận dạng giọng nói

Mô-đun nhận dạng giọng nói

Micrô hoặc Mike

Micrô, đôi khi được ký hiệu là micrô hoặc mike, là cảm biến hoặc đầu dò được sử dụng để chuyển đổi âm thanh thành tín hiệu điện. Các ứng dụng của micrô chủ yếu liên quan đến máy ghi âm, radio, phát sóng TV, điện thoại. Trong micrô tụ điện còn được gọi là micrô tụ điện, màng ngăn hoạt động như một đầu cực của tụ điện và độ rung thay đổi trong khoảng cách giữa hai đầu cực. Để trích xuất âm thanh o / p từ đầu dò, có hai phương pháp được gọi là micrô phân cực DC và micrô tụ điện HF hoặc RF.


Bộ vi điều khiển

MCU là một máy tính trên chip và nó có mức tiêu thụ điện năng thấp, khả năng tự cung cấp, tích hợp cao. Bộ vi điều khiển thường tích hợp các phần tử phụ như ROM để lưu trữ mã, bộ nhớ R / W để lưu trữ các giao diện I / O dữ liệu và các thiết bị ngoại vi. MCU này tiêu thụ ít năng lượng hơn và nói chung nó có khả năng ngủ trong khi chờ đợi một sự kiện ngoại vi khác như khi một nút được nhấn để đánh thức họ và làm lại điều gì đó.

PIC 18F8720

PIC 18F8720

Bộ vi điều khiển thường được sử dụng trong các thiết bị và sản phẩm được điều khiển tự động, chẳng hạn như điều khiển từ xa, hệ thống điều khiển động cơ ô tô, dụng cụ điện, máy văn phòng, đồ chơi và thiết bị gia dụng. Bằng cách giảm chi phí, kích thước và mức tiêu thụ điện năng so với các thiết bị I / O khác, bộ vi xử lý, bộ nhớ, vi điều khiển làm cho việc kiểm soát nhiều quy trình bằng điện tử không tốn kém.

Máy tính bảng đơn-Atmega32

ATmega321644 là một máy tính nhỏ với bo mạch đơn dựa trên họ Atmel, chẳng hạn như ATmega32 hoặc Atmel ATmega644 Bộ xử lý AVR . Bảng này được thiết kế với sự hợp tác của Holger Bu, Ulrich Radig và Thomas Scherer với mục đích đầu tiên là điều khiển máy pha cà phê từ xa thông qua internet.

Máy tính bảng đơn-Atmega32

Máy tính bảng đơn-Atmega32

Máy tính bảng đơn này hỗ trợ tối đa 2048 byte RAM. Nó bao gồm một hệ điều hành nhúng được thiết kế đặc biệt. Mặc dù khá liên quan đến ECB-ATmega321644 và ECB-AT91, có các tính năng riêng biệt. Nó hoạt động trong phạm vi tiêu thụ năng lượng tối thiểu thấp hơn 100mA. Nó vẫn được sử dụng như một máy chủ web để giám sát web cam, điều khiển từ xa dựa trên web. Tuy nhiên, lượng điện năng nhỏ, dung lượng của máy chủ web thấp và chủ yếu là thiết bị hướng đến cường độ sử dụng thấp.

Màn hình LCD

Màn hình tinh thể lỏng (LCD) là một màn hình phẳng và mỏng và nó được tạo thành từ các điểm ảnh đơn sắc được bố trí phía trước gương phản xạ. Nó thường được sử dụng trong các thiết bị điện tử chạy bằng pin. Bởi vì nó bao gồm một lượng điện năng nhỏ. Màn hình LCD được sử dụng trong dự án này là kiểu chữ và số hiển thị các ký tự chữ cái, ký hiệu và số từ bộ ký tự ASCII tiêu chuẩn. Loại màn hình này cũng hiển thị đồ họa có độ phân giải thấp.

Màn hình LCD

Màn hình LCD

Phát triển phần mềm

Multisim 2001

Công cụ Multisim 2001 được sử dụng để thiết kế một hệ thống và nó cung cấp một lượng lớn cơ sở dữ liệu, mục nhập giản đồ, mô phỏng, thiết kế VHDL, tổng hợp FPGAICPLD, khả năng RF, Xử lý hậu kỳ, v.v. Công cụ này cung cấp một giao diện đồ họa duy nhất và dễ sử dụng cho tất cả các thiết kế và cung cấp các chức năng nâng cao, nhưng bạn phải lấy thiết kế từ khâu sản xuất. Bởi vì, chương trình tích hợp bố cục PCB, logic lập trình, chụp và mô phỏng giản đồ.

Multisim 2001

Multisim 2001

  • Nó hỗ trợ tất cả quá trình thiết kế mạch, bao gồm thiết kế nhập vào công cụ phần mềm đang được sử dụng
  • Xác minh hành vi của mạch, điều này được thực hiện bằng cách sử dụng mô phỏng và phân tích.
  • Sửa đổi thiết kế mạch, nếu hoạt động của mạch đáp ứng mong đợi.

Ví dụ, nếu nó được đặt trên bảng mạch in , bước tiếp theo là sử dụng chương trình bố trí PCB (Sản phẩm Ultiboard của Electronics Workbench). Nếu nó được đặt trên PLD (thiết bị logic có thể lập trình) hoặc CPLD hoặc FPGA bước tiếp theo là sử dụng một công cụ tổng hợp, có sẵn từ Electronics Workbench.

Đây là tất cả về hệ thống nhận dạng giọng nói và nó đang hoạt động. Chúng tôi hy vọng rằng bạn đã hiểu rõ hơn về khái niệm này. Hơn nữa, bất kỳ câu hỏi nào liên quan đến chủ đề này hoặc mô-đun nhận dạng giọng nói , vui lòng đưa ra phản hồi của bạn bằng cách bình luận trong phần bình luận bên dưới. Đây là một câu hỏi cho bạn, các ứng dụng của hệ thống nhận dạng giọng nói là gì.

Tín ảnh:

  • Hệ thống bảo mật nhận dạng giọng nói của zeendo
  • Mô-đun nhận dạng giọng nói của imimg
  • ATmega321644 bởi đồ mỏng
  • Multisim 2001 bởi downza