Deep Learning là gì? Nó hoạt động như thế nào? Sự khác biệt giữa Machine Learning (học máy) và Deep Learning (học sâu) là gì? Chúng tôi chia nhỏ phân nhánh của trí tuệ nhân tạo này theo cách đơn giản để bạn có thể giải thích nó – ngay cả với những người không chuyên.
Việc hiểu về lĩnh vực trí tuệ nhân tạo đôi khi không nặng về mặt công nghệ mà phần nhiều là về mặt thuật ngữ. Có rất nhiều thứ nằm bên dưới “chiếc ô dù” AI rộng lớn bên trên – như Machine Learning, xử lý ngôn ngữ tự nhiên (Natural Laguage Processing), điện toán thị giác (Computer Vision), v.v…
Tổng hợp vấn đề này, một số thuật ngữ AI chồng chéo lên nhau. Có thể xác định rõ ràng các khái niệm chính – và sau đó hiểu các mối quan hệ và sự khác biệt giữa chúng – là nền tảng để bạn xây dựng một chiến lược AI vững chắc . Ngoài ra, nếu các nhà lãnh đạo CNTT trong tổ chức của bạn không thể đưa ra các thuật ngữ như Deep Learning, làm thế nào họ có thể mong đợi giải thích nó (và các khái niệm khác) cho số đông còn lại của công ty?
Deep Learning là gì?
Deep Learning là một ví dụ rõ nét về vấn đề này: Nó liên quan đến – nhưng không thể thay thế cho nhau – phạm trù rộng hơn của Machine Learning. Điều này làm trầm trọng thêm khả năng cho những hiểu lầm thường thấy. Trên thực tế, có một sự tương đồng với những cô búp bê Nga ở đây: Deep Learning nằm bên trong Machine Learning, Machine Learning lại nằm trong Trí tuệ nhân tạo / AI.
Trí thông minh nhân tạo về cơ bản là khi máy móc thực hiện các nhiệm vụ thường đòi hỏi trí thông minh của con người. Lĩnh vực trí tuệ nhân tạo bao gồm Machine Learning, trong đó máy móc có thể học hỏi bằng kinh nghiệm và có được các kỹ năng mà không cần sự tham gia của con người, ông Bill Brock, phó giáp đốc kỹ thuật tại Very, giải thích. Deep Learning là một nhánh của Machine Learning, trong đó mạng lưới thần kinh – thuật toán lấy cảm hứng từ bộ não con người – học từ một lượng lớn dữ liệu.
Deep Learning so với Machine Learning
Chúng ta hãy giảm bớt sự nhầm lẫn tiềm ẩn bằng cách đưa ra một định nghĩa rõ ràng về Deep Learning và nó khác với Machine Learning như thế nào.
Trong nghiên cứu sâu, thuật toán được cung cấp dữ liệu thô và tự quyết định những tính năng có liên quan.
Deep Learning là một nhánh của Machine Learning sử dụng mạng lưới thần kinh với nhiều lớp. Một mạng lưới thần kinh sâu phân tích dữ liệu với các biểu diễn đã học tương tự như cách một người nhìn vào một vấn đề, theo ông Bro Brock. Trong Machine Learning truyền thống, thuật toán được cung cấp một tập hợp các tính năng có liên quan để phân tích. Tuy nhiên, trong nghiên cứu sâu, thuật toán được cung cấp dữ liệu thô và tự quyết định các tính năng có liên quan. Mạng Deep Learning thường sẽ cải thiện khi bạn tăng lượng dữ liệu được sử dụng để đào tạo chúng.
Deep Learning về bản chất là một nhánh của AI cố gắng bắt chước cách thức hoạt động của bộ não con người. Điều này đáng ghi nhớ – không có ý định chơi chữ – khi giải thích hoặc truyền giáo Deep Learning cho người khác, đặc biệt nếu họ không có nền tảng kỹ thuật.
Giống như con người học hỏi từ kinh nghiệm, một thuật toán Deep Learning có thể thực hiện một nhiệm vụ nhiều lần, mỗi lần điều chỉnh nó để cải thiện kết quả, theo Bro Brock nói. Thuật ngữ “Deep Learning” dùng để chỉ các mạng lưới thần kinh có nhiều lớp cho phép học tập. Deep Learning có thể giải quyết bất kỳ vấn đề nào cần ‘suy nghĩ’ để tìm ra.
Làm thế nào để giải thích rõ nhất về Deep Learning: Một sự tương đồng
Cũng rất hữu ích khi có một bối cảnh lịch sử nhỏ để tạo tiền đề cho lý do tại sao việc Deep Learning lại quan trọng – không chỉ đối với các chuyên gia CNTT mà còn với rất nhiều người.
Trong nhiều thập kỷ, để làm cho máy tính đáp ứng yêu cầu cần cung cấp thông tin của chúng ta, chúng ta đã phải học cách nói chuyện với nó theo cách nó sẽ hiểu, Tom nói, Tom Wilde, CEO của Indico Data Solutions . Điều này có nghĩa là phải học những thứ như ngôn ngữ truy vấn boolean (đúng/sai) hoặc cách viết các quy tắc phức tạp hướng dẫn cẩn thận cho máy tính những hành động cần thực hiện. Điều này buộc phải áp đặt lớn đối với người dùng và có nghĩa là chỉ một số ít người có kỹ năng mới có thể lấy thành công thông tin từ các hệ thống thông tin dựa trên máy tính.
Wilde lưu ý rằng ông thường xuyên đưa ra các câu hỏi về cách giải thích tốt nhất cho Deep Learning từ khách hàng. Điều này đặc biệt quan trọng bởi vì những người không chuyên về kỹ thuật có thể được hưởng lợi nhiều nhất từ sự thay đổi mô hình từ điện toán truyền thống sang Deep Learning.
Sự xuất hiện của Deep Learning lật ngược bối cảnh mang tính lịch sử đó. Giờ đây, máy tính nói chuyện với chúng ta, bạn không cần phải lo lắng về việc cẩn thận xây dựng yêu cầu của mình trước – còn được gọi là lập trình – nhưng chỉ cần cung cấp các định nghĩa về kết quả mong muốn và một bộ ví dụ đầu vào và thuật toán Deep Learning sẽ lần ngược và giải quyết câu trả lời cho câu hỏi của bạn. Bây giờ những người không chuyên kỹ thuật có thể tạo các yêu cầu phức tạp mà không cần biết lập trình.
Bạn cần một điều tương đồng khác? Hãy nghĩ về một đứa trẻ học ngôn ngữ.
Học tập sâu như thế nào: Hãy nghĩ về bộ não của đứa trẻ.
Giúp người khác hiểu Deep Learning một lần nữa có thể được thúc đẩy bằng cách so sánh với bộ não con người – đặc biệt là của một đứa trẻ.
Sau khi có đủ phản hồi, cuối cùng đứa trẻ cũng hình thành một mô hình suy nghĩ bên trong về cách gắn nhãn các vật thể khác nhau trên thế giới.
Một người nhìn vào cách một đứa trẻ học ngôn ngữ: Đứa trẻ chỉ vào một vật thể và nói, ‘ô tô’. Cha mẹ của đứa trẻ ngay lập tức cung cấp phản hồi: ‘Phải’ hoặc ‘Không, đó là một cái bình’, ‘Moshe Kranc, CTO tại Ness Digital Engineering, giải thích. Sau khi có đủ phản hồi, cuối cùng đứa trẻ hình thành một mô hình suy nghĩ bên trong về cách gắn nhãn các vật thể khác nhau trên thế giới. Làm thế nào để bộ não của trẻ tổ chức hàng tỷ tế bào thần kinh để đưa ra câu trả lời đúng trong hầu hết thời gian? Mỗi nơ-ron truyền tín hiệu đến các nơ-ron khác, trong một loại phân cấp phức tạp không thể giải thích được hình thành dựa trên phản hồi.
Một cách để suy nghĩ về chữ “deep” bên trong Deep Learning là, giống như với bộ não con người, chúng ta không nhất thiết phải hiểu mọi yếu tố trong một quyết định hoặc kết quả, vì nó liên quan đến các cấp độ phức tạp ngày càng tăng. Nhưng đó thực chất là những gì Deep Learning đang cố gắng bắt chước: Sự phức tạp nhưng đây sức mạnh của bộ não con người.
Chúng tôi tạo ra một mạng lưới thần kinh gồm các tri giác, [hoặc] các nơ-ron kỹ thuật số, được sắp xếp thành các lớp, với các tri giác của mỗi lớp được liên kết với các tri giác của lớp tiếp theo, Kranc nói. Sau đó, chúng tôi cung cấp dữ liệu huấn luyện, [chẳng hạn như] hình ảnh của các đối tượng, cho mạng lưới thần kinh và để nó cố gắng đoán từng đối tượng là gì. Tất nhiên, dự đoán ban đầu của nó sẽ rất thô sơ. Nhưng khi chúng tôi cung cấp thông tin phản hồi, mạng lưới thần kinh sẽ điều chỉnh cách thức các tri giác của nó được kết nối cho đến khi nó tạo ra các dự đoán có độ chính xác cao. Tại thời điểm đó, chúng tôi có một mô hình được đào tạo có thể gắn nhãn các đối tượng với độ chính xác cao.
Đó là chìa khóa cho tiềm năng lâu dài và đầy hứa hẹn của Deep Learning: Nó tự cải thiện theo thời gian và không có giới hạn nào cho việc cải tiến đó. Nhưng giống như với việc ra quyết định của con người, có thể có một số điều không rõ ràng khi giải mã những quyết định đó ở cấp độ chi tiết.
Thật không may, như với bộ não của trẻ em, rất khó để giải thích mỗi lớp hoặc mỗi tri giác ‘biết’ hay ‘đại diện’, bởi vì điều quan trọng không phải là các tri giác riêng lẻ mà là cách chúng được kết nối với nhau, Kranc nói.
Deep Learning và những định kiến: Một khu vực nguy hiểm
Giống như các nhánh khác của AI, Deep Learning không phải không có những vần đề quan trọng cần cân nhắc, chẳng hạn như khả năng thiên vị . Nếu lời giải thích rộng nhất về Deep Learning đó là một nỗ lực phản chiếu bộ não của con người bằng một cái máy, thì nó sẽ dẫn đến rằng cái máy đó dễ bị cuốn theo lỗi của con người.
Điều đó là một lý do khác để những người không chuyên về kỹ thuật có được ít nhất là sự hiểu biết cơ bản về Deep Learning và cách thức nó hoạt động.
Thật dễ dàng để tin tưởng một cách mù quáng vào kết quả của một thuật toán Deep Learning, nhưng giống như bất kỳ thuật toán Machine Learning nào, kết quả chỉ tốt như dữ liệu mà được thuật toán đào tạo trên đó, theo Bro Brock nói. Nếu dữ liệu chứa sự thiên vị vô thức hoặc các vấn đề với sự công bằng, Machine Learning có thể sao chép các vấn đề đó. Những mối quan tâm về đạo đức này rất quan trọng cần ghi nhớ khi chúng ta sử dụng các ứng dụng khai thác Deep Learning.
Điều đó là một lý do khác để những người không chuyên về kỹ thuật có được ít nhất là sự hiểu biết cơ bản về Deep Learning và cách thức nó hoạt động. Trên thực tế, Brock lưu ý rằng khi các ứng dụng của học tập sâu và các môn học AI khác phát triển trong cuộc sống hàng ngày của chúng ta – từ các tương tác dịch vụ khách hàng đến các chẩn đoán y tế, chẳng hạn – sẽ rất quan trọng đối với mọi người để hiểu về cách thức hoạt động của nó.
Tương tự như vậy, giống như với các phát triển công nghệ quan trọng khác, không ai có thể mong đợi nó một cách dễ dàng, như là điều mặc nhiên.
Nói một cách công bằng, đó không phải là một bữa trưa miễn phí. Deep Learning là một ‘người học’ rất thông minh nhưng cũng là một ‘người học’ rất chậm. Nó cần hàng trăm ngàn ví dụ để tìm ra giải pháp cho vấn đề mẫu mà người dùng đặt ra. Những đột phá mới với các phương pháp như học chuyển giao cho phép các thuật toán Deep Learning học được với một phần rất nhỏ trong khối lượng các ví dụ đào tạo thường được yêu cầu. Bất kể, lần đầu tiên chúng ta chuyển từ việc cần phải học nói ngôn ngữ của máy tính sang việc học nói tiếng của chúng ta.
Transfer Learning là gì?
Transfer Learning không phải là một khái niệm mới – ví dụ, các nhà nghiên cứu của Đại học Wisconsin đã viết về nó vào năm 2009 – nhưng dường như nó sẽ trở thành một lĩnh vực làm gia tăng sự quan tâm đến Machine Learning. Trong một bài viết trên trang Medium, người sáng lập KC AI Lab, Brian Curry định nghĩa Transfer Learning là một phương pháp Machine Learning trong đó một mô hình được phát triển cho một nhiệm vụ được sử dụng lại làm điểm khởi đầu cho một mô hình trong nhiệm vụ thứ hai. Học chuyển giao khác với Machine Learning truyền thống ở chỗ nó là việc sử dụng các mô hình được đào tạo trước đã được sử dụng cho một nhiệm vụ khác để bắt đầu quá trình phát triển cho một nhiệm vụ hoặc vấn đề mới.
Nói cách khác, đó là sự theo đuổi để tiếp cận Machine Learning – và sau đó là môn học phụ của Deep Learning – có thể tái sử dụng nhiều hơn, trái ngược với các mô hình sử dụng một lần phổ biến hơn, không rút ngắn thời gian học tập trong các nhiệm vụ mới.
Một lần nữa, có rất nhiều thuật ngữ AI bên ngoài – có lẽ nhiều hơn rất nhiều so với hầu hết mọi người cần biết. Transfer Learning có thể là một tập hợp con không cần phải có trên “tầm phủ sóng” của mọi người trừ khi họ thực sự làm việc trên Machine Learning hoặc các môn học AI khác. Deep Learning, mặt khác, đã đáng để giải thích cho một đối tượng rộng lớn hơn nhiều trong tổ chức của chúng ta.
Deep Learning ngày càng trở thành một phần trong cuộc sống hàng ngày của chúng ta và điều quan trọng đối với [mọi người] là hiểu được những điều cơ bản về cách thức hoạt động của nó, theo Bro Brock nói.
Bài viết liên quan
- AI trong ngành Logistics: Những lợi ích chính và ứng dụng
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Tôi có cần CPU kép không?
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform
- Hướng dẫn lựa chọn GPU phù hợp cho AI, Machine Learning
- LLM: Lịch sử và tương lai của các mô hình ngôn ngữ lớn