Review 47-49 #460

khoangothe · 2019-12-22T17:33:07Z

Nếu bạn tạo Pull Request để dịch, vui lòng hoàn thành các thông tin dưới đây.

Đánh dấu [x] (không có dấu cách quanh x) thể hiện dấu tick vào các câu dưới đây cho các câu trả lời 'Có' hoặc 'Đúng'
Pull Request này được link tới một issue? Đánh số issue đó ngay sau dấu #: close Revise chương 47-49 #422
Bạn có kiến thức về Học Máy không? Chúng tôi ưu tiên những người có trước kiến thức về Học Máy để việc review được thuận tiện hơn.
Bạn đã đọc Bảng thuật ngữ chưa? Bạn cần dịch các thuật ngữ theo bảng thuật ngữ chung.
Pull request này đã sẵn sàng cho việc review chưa?

Lưu ý

Chỉ bắt đầu review khi mọi mục trên đây đều đã được tick.

chapters/ch49.md

khoangothe · 2019-12-22T17:34:21Z

chapters/ch49.md


 > * The MFCC features are robust to some properties of speech that do not affect the content, such as speaker pitch. Thus, they help simplify the problem for the learning algorithm.

-* Đặc trưng MFCC có tính kháng tốt đối với một vài tính chất không ảnh hưởng tới nội dung của tiếng nói, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp giản lược vấn đề của thuật toán học.
+* Đặc trưng MFCC có tính kháng tốt đối với một vài thuộc tính không ảnh hưởng tới nội dung của tiếng nói, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp đơn giản hóa vấn đề cho thuật toán học.

 > * To the extent that phonemes are a reasonable representation of speech, they can also help the learning algorithm understand basic sound components and therefore improve its performance.


To the extent ở đây em hiểu làm "trong phạm vi"

Ý của tác giả trong đoạn này là "Nếu hiểu theo hướng này".

tiepvupsu

Cảm ơn em. Anh có vài comment nhỏ.

chapters/ch47.md

tiepvupsu · 2019-12-22T18:09:07Z

chapters/ch49.md


 > * The MFCC features are robust to some properties of speech that do not affect the content, such as speaker pitch. Thus, they help simplify the problem for the learning algorithm.

-* Đặc trưng MFCC có tính kháng tốt đối với một vài tính chất không ảnh hưởng tới nội dung của tiếng nói, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp giản lược vấn đề của thuật toán học.
+* Đặc trưng MFCC có tính kháng tốt đối với một vài thuộc tính không ảnh hưởng tới nội dung của tiếng nói, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp đơn giản hóa vấn đề cho thuật toán học.

 > * To the extent that phonemes are a reasonable representation of speech, they can also help the learning algorithm understand basic sound components and therefore improve its performance.


Ý của tác giả trong đoạn này là "Nếu hiểu theo hướng này".

chapters/ch49.md

Co-Authored-By: tiepvupsu <[email protected]>

lkhphuc

Vài gợi ý của mình.

chapters/ch47.md

lkhphuc · 2019-12-23T14:12:51Z

chapters/ch47.md


 ![img](../imgs/C47_02.png)

 > Neural networks are commonly used in end-to-end learning systems. The term "end-to-end" refers to the fact that we are asking the learning algorithm to go directly from the input to the desired output. I.e., the learning algorithm directly connects the "input end" of the system to the "output end."

-Mạng neural được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh thực tế là chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn. Tức là, thuật toán học kết nối trực tiếp "đầu vào" cho đến "đầu ra" của hệ thống.
+Mạng nơ-ron được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh việc chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn: Thuật toán học nối trực tiếp "đầu vào" và "đầu ra" của hệ thống.


Chỗ này ông Andrew viết nhấn mạnh "input end" và "output end" để giải thích từ "end-to-end".
Mình dịch là "đầu-cuối" thì có cách nào viết lại câu này cho có chữ "đầu và cuối" luôn không nhỉ? Như hiện tại "đầu vào - đầu ra" chưa giải thích rõ lắm ý của thuật ngữ "đầu-cuối", mà mình chưa nghĩ ra cách dịch nào hay hơn.

đoạn này mình nghĩ nên giải thích hẳn nghĩa của từ end-to-end ra. Bác ấy giải thích cũng không rõ ý lắm. Vì end-to-end learning là tất cả các quá trình từ đầu đến cuối đều được học cùng nhau.

Dịch thô là "phía đầu" và "phía cuối" chăng?

Thuật toán học nối trực tiếp "phía đầu" và "phía cuối" của hệ thống

chapters/ch48.md

chapters/ch49.md

lkhphuc · 2019-12-23T14:22:11Z

chapters/ch49.md


 > * To the extent that phonemes are a reasonable representation of speech, they can also help the learning algorithm understand basic sound components and therefore improve its performance.

-* Theo hướng hệ âm vị là một biểu diễn khá hợp lý của tiếng nói, chúng cũng có thể giúp thuật toán học hiểu được các thành phần cơ bản của âm thanh và bởi vậy cải thiện chất lượng của hệ thống.
+* Những trường hợp hệ âm vị là một biểu diễn khá hợp lý của tiếng nói, chúng cũng có thể giúp thuật toán học hiểu được các thành phần cơ bản của âm thanh và vì vậy cải thiện chất lượng của hệ thống.


Suggested change

* Những trường hợp hệ âm vị là một biểu diễn khá hợp lý của tiếng nói, chúng cũng có thể giúp thuật toán học hiểu được các thành phần cơ bản của âm thanh và vì vậy cải thiện chất lượng của hệ thống.

* Trong trường hợp hệ âm vị là một biểu diễn khá hợp lý của tiếng nói, chúng cũng có thể giúp thuật toán học hiểu được các thành phần cơ bản của âm thanh và vì vậy cải thiện chất lượng của hệ thống.

chapters/ch49.md

Co-Authored-By: Phúc Lê <[email protected]>

ngcthuong

Mình có khá nhiều comments. Em tham khảo nhé.
Cảm ơn vì bài dịch.

ngcthuong · 2019-12-24T03:22:01Z

chapters/ch47.md

@@ -4,35 +4,35 @@

 > Suppose you want to build a system to examine online product reviews and automatically tell you if the writer liked or disliked that product. For example, you hope to recognize the following review as highly positive:

-Giả sử bạn muốn xây dựng một hệ thống kiểm tra đánh giá các phản hồi sản phẩm trực tuyến và tự động cho biết liệu người viết có thích sản phẩm đó hay không. Ví dụ, bạn hi vọng có thể nhận ra phản hồi dưới đây là tích cực:
+Giả sử bạn muốn xây dựng một hệ thống để kiểm tra đánh giá phản hồi của sản phẩm trực tuyến và tự động cho biết liệu người viết có thích sản phẩm đó hay không. Ví dụ, bạn muốn hệ thống đó phân loại phản hồi dưới đây là tích cực:


Suggested change

Giả sử bạn muốn xây dựng một hệ thống để kiểm tra đánh giá phản hồi của sản phẩm trực tuyến và tự động cho biết liệu người viết có thích sản phẩm đó hay không. Ví dụ, bạn muốn hệ thống đó phân loại phản hồi dưới đây là tích cực:

Giả sử bạn muốn xây dựng một hệ thống để kiểm tra phản hồi đánh giá của sản phẩm trực tuyến và tự động trả về liệu người viết phản hồi có thích sản phẩm đó hay không. Ví dụ, bạn muốn hệ thống đó phân loại phản hồi dưới đây là tích cực:

ngcthuong · 2019-12-24T03:24:32Z

chapters/ch47.md


 > 1. Parser: A system that annotates the text with information identifying the most important words.[15] For example, you might use the parser to label all the adjectives and nouns. You would therefore get the following annotated text:

-1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất. [15] Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:
+1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất[15] .Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn cho tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:


Suggested change

1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất[15] .Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn cho tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:

1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất [15]. Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn cho tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:

thêm dấu cách trước khi trích dẫn [15] và sau dấu chấm

ngcthuong · 2019-12-24T03:24:57Z

chapters/ch47.md


 > 1. Parser: A system that annotates the text with information identifying the most important words.[15] For example, you might use the parser to label all the adjectives and nouns. You would therefore get the following annotated text:

-1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất. [15] Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:
+1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất[15] .Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn cho tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:

 > This is a great<sub>Adjective</sub> mop<sub>Noun</sub>!

 Cây lau nhà<sub>Danh Từ</sub> này thật tuyệt<sub>Tính từ</sub>!


Suggested change

Cây lau nhàDanh Từ này thật tuyệtTính từ!

Cây lau nhà nàyDanh Từ thật tuyệtTính từ!

ngcthuong · 2019-12-24T03:26:46Z

chapters/ch47.md


 > This is a great<sub>Adjective</sub> mop<sub>Noun</sub>!

 Cây lau nhà<sub>Danh Từ</sub> này thật tuyệt<sub>Tính từ</sub>!

 > 2. Sentiment classifier: A learning algorithm that takes as input the annotated text and predicts the overall sentiment. The parser’s annotation could help this learning algorithm greatly: By giving adjectives a higher weight, your algorithm will be able to quickly hone in on the important words such as "great," and ignore less important words such as "this."

-2. Bộ phân loại cảm xúc: Một thuật toán học sử dụng đầu vào là văn bản đã chú thích để dự đoán cảm xúc tổng thể. Khả năng chú thích của bộ phân tích cú pháp có thể giúp ích rất nhiều thuật toán học: Bằng việc tập trung hơn vào các tính từ, thuật toán của bạn có thể nhanh chóng xác định các từ quan trọng như "tuyệt", và lờ đi những từ ít quan trọng hơn như "này".
+2. Bộ phân loại cảm xúc: Một thuật toán học sử dụng đầu vào là văn bản đã chú thích để dự đoán cảm xúc tổng thể. Những chú thích của bộ phân tích cú pháp có thể giúp ích thuật toán học này rất nhiều: Bằng việc tập trung hơn vào các tính từ, thuật toán có thể nhanh chóng xác định các từ quan trọng như "tuyệt", và lờ đi những từ ít quan trọng hơn như "này".


Suggested change

2. Bộ phân loại cảm xúc: Một thuật toán học sử dụng đầu vào là văn bản đã chú thích để dự đoán cảm xúc tổng thể. Những chú thích của bộ phân tích cú pháp có thể giúp ích thuật toán học này rất nhiều: Bằng việc tập trung hơn vào các tính từ, thuật toán có thể nhanh chóng xác định các từ quan trọng như "tuyệt", và lờ đi những từ ít quan trọng hơn như "này".

2. Bộ phân loại cảm xúc: Một thuật toán học sử dụng đầu vào là văn bản đã chú thích để dự đoán cảm xúc tổng thể. Những chú thích của bộ phân tích cú pháp có thể giúp ích thuật toán học này rất nhiều: Bằng việc tập trung hơn vào các tính từ, thuật toán có thể nhanh chóng xác định các từ quan trọng như "tuyệt" và lờ đi những từ ít quan trọng hơn như "này".

xóa dấu phẩy

ngcthuong · 2019-12-24T03:27:46Z

chapters/ch47.md

@@ -42,17 +42,17 @@ Chúng ta có thể hình dung "pipeline" của hai thành phần này như sau:

 > There has been a recent trend toward replacing pipeline systems with a single learning algorithm. An **end-to-end learning algorithm** for this task would simply take as input the raw, original text "This is a great mop!", and try to directly recognize the sentiment:

-Xu hướng gần đây là thay đổi hệ thống pipeline với một thuật toán duy nhất. Một **thuật toán đầu-cuối** cho tác vụ này sẽ đơn giản là thu thập văn bản gốc "Cây lau nhà này thật tuyệt!", và cố gắng trực tiếp nhận ra cảm xúc từ nó:
+Xu hướng gần đây là thay đổi hệ thống pipeline bởi một thuật toán duy nhất. Một **thuật toán đầu-cuối** cho tác vụ này chỉ cần nhận vào đoạn văn bản gốc "Cây lau nhà này thật tuyệt!", rồi cố gắng trực tiếp nhận ra cảm xúc từ văn bản gốc đó:


Suggested change

Xu hướng gần đây là thay đổi hệ thống pipeline bởi một thuật toán duy nhất. Một **thuật toán đầu-cuối** cho tác vụ này chỉ cần nhận vào đoạn văn bản gốc "Cây lau nhà này thật tuyệt!", rồi cố gắng trực tiếp nhận ra cảm xúc từ văn bản gốc đó:

Xu hướng gần đây là thay đổi hệ thống pipeline bởi một thuật toán duy nhất. Một **thuật toán học đầu-cuối** cho tác vụ này chỉ cần nhận vào đoạn văn bản gốc "Cây lau nhà này thật tuyệt!", rồi cố gắng trực tiếp nhận ra cảm xúc từ văn bản gốc đó:

ngcthuong · 2019-12-24T03:44:50Z

chapters/ch49.md


 > These hand-engineered components limit the potential performance of the speech system. However, allowing hand-engineered components also has some advantages:

-Các thành phần được thiết kế thủ công này giới hạn chất lượng tiềm năng của hệ thống tiếng nói. Tuy nhiên, sử dụng các thành phần được thiết kế thủ công cũng có một vài ưu điểm:
+Các thành phần được thiết kế thủ công này giới hạn chất lượng tiềm năng của hệ thống tiếng nói. Tuy nhiên, việc sử dụng các thành phần được thiết kế thủ công cũng có một vài ưu điểm:


Suggested change

Các thành phần được thiết kế thủ công này giới hạn chất lượng tiềm năng của hệ thống tiếng nói. Tuy nhiên, việc sử dụng các thành phần được thiết kế thủ công cũng có một vài ưu điểm:

Các thành phần được thiết kế thủ công này giới hạn chất lượng tiềm năng của hệ thống giọng nói. Tuy nhiên, việc sử dụng các thành phần được thiết kế thủ công cũng có một vài ưu điểm:

ngcthuong · 2019-12-24T03:46:29Z

chapters/ch49.md


 > * The MFCC features are robust to some properties of speech that do not affect the content, such as speaker pitch. Thus, they help simplify the problem for the learning algorithm.

-* Đặc trưng MFCC có tính kháng tốt đối với một vài tính chất không ảnh hưởng tới nội dung của tiếng nói, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp giản lược vấn đề của thuật toán học.
+* Đặc trưng MFCC có tính kháng tốt đối với một vài thuộc tính không ảnh hưởng tới nội dung của tiếng nói, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp đơn giản hóa vấn đề cho thuật toán học.


Suggested change

* Đặc trưng MFCC có tính kháng tốt đối với một vài thuộc tính không ảnh hưởng tới nội dung của tiếng nói, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp đơn giản hóa vấn đề cho thuật toán học.

* Đặc trưng MFCC có tính kháng tốt đối với một vài thuộc tính của giọng nói mà không ảnh hưởng tới nội dung, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp đơn giản hóa vấn đề cho thuật toán học.

ngcthuong · 2019-12-24T03:47:53Z

chapters/ch49.md

@@ -48,16 +48,16 @@ Hệ thống này thiếu đặc trưng được thiết kế thủ công. Bởi

 > However, when the training set is large, then it is not hampered by the limitations of an MFCC or phoneme-based representation. If the learning algorithm is a large-enough neural network and if it is trained with enough training data, it has the potential to do very well, and perhaps even approach the optimal error rate.

-Tuy nhiên, khi tập huấn luyện lớn, nó không bị cản trở bới giới hạn của một biểu diễn MFCC hay hệ dựa trên hệ âm vị. Nếu thuật toán học là một mạng nơ-ron đủ lớn và được huấn luyện trên dữ liệu huấn luyện đủ lớn, nó có tiềm năng hoạt động tốt, và có thể đạt được tỉ lệ lỗi tối ưu.
+Tuy nhiên, khi tập huấn luyện lớn, nó không bị cản trở bởi giới hạn biểu diễn của MFCC hay hệ âm vị. Nếu thuật toán học là một mạng nơ-ron đủ lớn và được huấn luyện trên dữ liệu đủ lớn, nó có tiềm năng hoạt động tốt và còn có thể đạt được tỉ lệ lỗi tối ưu.


Suggested change

Tuy nhiên, khi tập huấn luyện lớn, nó không bị cản trở bởi giới hạn biểu diễn của MFCC hay hệ âm vị. Nếu thuật toán học là một mạng nơ-ron đủ lớn và được huấn luyện trên dữ liệu đủ lớn, nó có tiềm năng hoạt động tốt và còn có thể đạt được tỉ lệ lỗi tối ưu.

Tuy nhiên, khi tập huấn luyện lớn, nó không bị cản trở bởi giới hạn biểu diễn của MFCC hay hệ âm vị. Nếu thuật toán học là một mạng nơ-ron đủ lớn và được huấn luyện trên dữ liệu đủ lớn, nó có tiềm năng hoạt động tốt và còn có thể đạt được tỉ lệ lỗi tối ưu.

cần ghi rõ giải nghĩa cho từ NÓ ở câu đầu, không rõ nghĩa.

ngcthuong · 2019-12-24T03:48:38Z

chapters/ch49.md


 > End-to-end learning systems tend to do well when there is a lot of labeled data for "both ends" -- the input end and the output end. In this example, we require a large dataset of (audio, transcript) pairs. When this type of data is not available, approach end-to-end learning with great caution.

-Hệ thống học đầu-cuối có xu hướng làm việc tốt khi có rất nhiều dữ liệu được gán nhãn cho "cả hai đầu" -- đầu vào và đầu ra. Trong ví dụ này, chúng ta yêu cầu một tập dữ liệu lớn các cặp (âm thanh, bản ghi). Khi dữ liệu kiểu nay không tồn tại, hãy đặc biệt lưu ý khi sử dụng học đầu-cuối.
+Hệ thống học đầu-cuối có xu hướng làm việc tốt khi có nhiều dữ liệu được gán nhãn cho "cả hai đầu" -- đầu vào và đầu ra. Trong ví dụ này, chúng ta cần một tập dữ liệu lớn các cặp (âm thanh, bản ghi). Khi chúng ta không có dữ liệu kiểu này, cần đặc biệt lưu ý khi sử dụng học đầu-cuối.


Suggested change

Hệ thống học đầu-cuối có xu hướng làm việc tốt khi có nhiều dữ liệu được gán nhãn cho "cả hai đầu" -- đầu vào và đầu ra. Trong ví dụ này, chúng ta cần một tập dữ liệu lớn các cặp (âm thanh, bản ghi). Khi chúng ta không có dữ liệu kiểu này, cần đặc biệt lưu ý khi sử dụng học đầu-cuối.

Hệ thống học đầu-cuối có xu hướng làm việc tốt khi có nhiều dữ liệu được gán nhãn cho "cả hai đầu" -- đầu vào và đầu ra. Trong ví dụ này, chúng ta cần một tập dữ liệu lớn các cặp (âm thanh, bản ghi thoại). Khi không có dữ liệu kiểu này, chúng ta cần đặc biệt lưu ý khi sử dụng học đầu-cuối.

ngcthuong · 2019-12-24T03:50:13Z

chapters/ch49.md


 > If you are working on a machine learning problem where the training set is very small, most of your algorithm’s knowledge will have to come from your human insight. I.e., from your "hand engineering" components.

-Nếu bạn đang làm việc với một bài toán học máy mà tập huấn luyện rất nhỏ, hầu hết các đặc trưng cho thuật toán phải đến từ hiểu biết của con người. Chẳng hạn, từ các thành phần được "thiết kế thủ công".
+Nếu bạn đang làm việc với một bài toán học máy mà tập huấn luyện rất nhỏ, hầu hết các đặc trưng cho thuật toán phải đến từ hiểu biết của con người: Từ các thành phần được "thiết kế thủ công".


Suggested change

Nếu bạn đang làm việc với một bài toán học máy mà tập huấn luyện rất nhỏ, hầu hết các đặc trưng cho thuật toán phải đến từ hiểu biết của con người: Từ các thành phần được "thiết kế thủ công".

Nếu bạn đang làm việc với một bài toán học máy mà tập huấn luyện rất nhỏ, hầu hết tri thức của thuật toán phải đến từ hiểu biết của con người: Từ các thành phần được "thiết kế thủ công".

rootonchair

Bạn sửa giùm mình "Compute features" ở dòng 17 chương 48 thành "Tính toán đặc trưng" giùm mình để giống với phần hình ảnh nhé. Thank bạn.

rootonchair · 2019-12-24T03:54:37Z

chapters/ch47.md


 > This mop is low quality -- I regret buying it.

 Cây lau nhà này thật kém chất lượng -- Tôi hối hận vì đã mua nó.

 > The problem of recognizing positive vs. negative opinions is called "sentiment classification." To build this system, you might build a "pipeline" of two components:

-Bài toán về nhận dạng các quan điểm tích cực và tiêu cực được gọi là "phân loại cảm xúc". Để xây dựng hệ thống này, bạn có thể tạo một "pipeline" bao gồm hai thành phần:
+Bài toán về nhận dạng quan điểm tích cực hoặc tiêu cực được gọi là "phân loại cảm xúc". Để xây dựng hệ thống này, bạn có thể tạo một "pipeline" gồm hai phần:


Suggested change

Bài toán về nhận dạng quan điểm tích cực hoặc tiêu cực được gọi là "phân loại cảm xúc". Để xây dựng hệ thống này, bạn có thể tạo một "pipeline" gồm hai phần:

Bài toán về nhận dạng quan điểm tích cực hoặc tiêu cực được gọi là "phân loại cảm xúc" (_sentiment classification_). Để xây dựng hệ thống này, bạn có thể tạo một "pipeline" gồm hai phần:

rootonchair · 2019-12-24T03:56:23Z

chapters/ch47.md


 > 1. Parser: A system that annotates the text with information identifying the most important words.[15] For example, you might use the parser to label all the adjectives and nouns. You would therefore get the following annotated text:

-1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất. [15] Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:
+1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất[15] .Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn cho tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:


Suggested change

1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất[15] .Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn cho tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:

1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất[15]. Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn cho tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:

rootonchair · 2019-12-24T04:00:52Z

chapters/ch47.md


 ![img](../imgs/C47_02.png)

 > Neural networks are commonly used in end-to-end learning systems. The term "end-to-end" refers to the fact that we are asking the learning algorithm to go directly from the input to the desired output. I.e., the learning algorithm directly connects the "input end" of the system to the "output end."

-Mạng neural được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh thực tế là chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn. Tức là, thuật toán học kết nối trực tiếp "đầu vào" cho đến "đầu ra" của hệ thống.
+Mạng nơ-ron được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh việc chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn: Thuật toán học nối trực tiếp "đầu vào" và "đầu ra" của hệ thống.


Suggested change

Mạng nơ-ron được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh việc chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn: Thuật toán học nối trực tiếp "đầu vào" và "đầu ra" của hệ thống.

Mạng nơ-ron được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh việc chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn: Thuật toán học nối trực tiếp "đầu vào" với "đầu ra" của hệ thống.

rootonchair · 2019-12-24T04:02:39Z

chapters/ch47.md


 ![img](../imgs/C47_02.png)

 > Neural networks are commonly used in end-to-end learning systems. The term "end-to-end" refers to the fact that we are asking the learning algorithm to go directly from the input to the desired output. I.e., the learning algorithm directly connects the "input end" of the system to the "output end."

-Mạng neural được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh thực tế là chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn. Tức là, thuật toán học kết nối trực tiếp "đầu vào" cho đến "đầu ra" của hệ thống.
+Mạng nơ-ron được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh việc chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn: Thuật toán học nối trực tiếp "đầu vào" và "đầu ra" của hệ thống.


Dịch thô là "phía đầu" và "phía cuối" chăng?

Thuật toán học nối trực tiếp "phía đầu" và "phía cuối" của hệ thống

rootonchair · 2019-12-24T04:14:52Z

chapters/ch48.md

@@ -18,27 +18,27 @@ Các thành phần sẽ hoạt động như sau:

 > 2. Phoneme recognizer: Some linguists believe that there are basic units of sound called "phonemes." For example, the initial "k" sound in "keep" is the same phoneme as the "c" sound in "cake." This system tries to recognize the phonemes in the audio clip.

-2. Nhận diện các âm vị: Các nhà ngôn ngữ học tin rằng trong ngôn ngữ có các đơn vị cơ bản gọi là "âm vị." Ví dụ, âm bắt đầu "k" trong từ "keep" thì phát âm giống âm "c" trong từ "cake". Hệ thống này sẽ cố gắng để nhận diện các âm vị trong các đoạn âm thanh.
+2. Nhận diện các âm vị: Một số nhà ngôn ngữ học tin rằng trong ngôn ngữ có các đơn vị cơ bản gọi là "âm vị." Ví dụ, âm bắt đầu "k" trong từ "keep" thì phát âm giống âm "c" trong từ "cake". Hệ thống này sẽ cố gắng để nhận diện các âm vị trong các đoạn âm thanh.


Suggested change

2. Nhận diện các âm vị: Một số nhà ngôn ngữ học tin rằng trong ngôn ngữ có các đơn vị cơ bản gọi là "âm vị." Ví dụ, âm bắt đầu "k" trong từ "keep" thì phát âm giống âm "c" trong từ "cake". Hệ thống này sẽ cố gắng để nhận diện các âm vị trong các đoạn âm thanh.

2. Bộ nhận dạng âm vị: Một số nhà ngôn ngữ học tin rằng trong ngôn ngữ có các đơn vị cơ bản gọi là "âm vị." Ví dụ, âm bắt đầu "k" trong từ "keep" thì phát âm giống âm "c" trong từ "cake". Hệ thống này sẽ cố gắng để nhận dạng các âm vị trong các đoạn âm thanh.

Trong ảnh mình dịch là "bộ nhận dạng đơn âm". Tuy nhiên mình thấy "bộ nhận dạng âm vị" sẽ chuẩn hơn.

rootonchair · 2019-12-24T04:17:40Z

chapters/ch48.md


 > 3. Final recognizer: Take the sequence of recognized phonemes, and try to string them together into an output transcript.

-3. Bộ nhận dạng cuối cùng: Dùng các chuỗi âm vị đã được nhận dạng, và cố gắng xâu chuỗi chúng lại với nhau thành một bản ghi thoại ở đầu ra.
+3. Bộ nhận dạng cuối cùng: Dùng các chuỗi âm vị đã được nhận dạng và cố gắng xâu chuỗi chúng với nhau thành một bản ghi thoại ở đầu ra.


Suggested change

3. Bộ nhận dạng cuối cùng: Dùng các chuỗi âm vị đã được nhận dạng và cố gắng xâu chuỗi chúng với nhau thành một bản ghi thoại ở đầu ra.

3. Bộ nhận dạng sau cuối: Dùng các chuỗi âm vị đã được nhận dạng và cố gắng xâu chuỗi chúng với nhau thành một bản ghi thoại ở đầu ra.

rootonchair · 2019-12-24T04:19:59Z

chapters/ch48.md

@@ -52,4 +52,4 @@ Ngược lại, hướng tiếp cận đầu-cuối có thể cố gắng lấy

 > Even though end-to-end learning has seen many successes, it is not always the best approach. For example, end-to-end speech recognition works well. But I’m skeptical about end-to-end learning for autonomous driving. The next few chapters explain why.

-Mặc dù phương pháp học đầu-cuối đã đạt được nhiều kết quả tốt, nó không phải luôn luôn là hướng đi tốt nhất. Ví dụ, phương pháp nhận dạng giọng nói đầu-cuối đạt kết quả tốt. Nhưng tôi cảm thấy hoài nghi về việc sử dụng học đầu-cuối cho xe tự lái. Những chương kế tiếp sẽ giải thích về vấn đề này.
+Mặc dù phương pháp học đầu-cuối đã đạt được nhiều kết quả tốt, nó không phải luôn luôn là hướng đi tốt nhất. Ví dụ, phương pháp nhận dạng giọng nói đầu-cuối đạt kết quả tốt nhưng tôi không tin tưởng việc sử dụng học đầu-cuối cho xe tự lái. Những chương kế tiếp sẽ giải thích tại sao.


Suggested change

Mặc dù phương pháp học đầu-cuối đã đạt được nhiều kết quả tốt, nó không phải luôn luôn là hướng đi tốt nhất. Ví dụ, phương pháp nhận dạng giọng nói đầu-cuối đạt kết quả tốt nhưng tôi không tin tưởng việc sử dụng học đầu-cuối cho xe tự lái. Những chương kế tiếp sẽ giải thích tại sao.

Mặc dù phương pháp học đầu-cuối đã đạt được nhiều kết quả tốt, nó không phải lúc nào cũng là hướng đi tốt nhất. Ví dụ, phương pháp nhận dạng giọng nói đầu-cuối đạt kết quả tốt nhưng tôi không tin tưởng việc sử dụng học đầu-cuối cho xe tự lái. Những chương kế tiếp sẽ giải thích tại sao.

tiepvupsu · 2019-12-25T02:04:19Z

Sắp xong rồi, @khoapip có đẩy nhanh hơn một chút rồi merge được không?

Xong cái này là mình có thể hoàn thiện cuốn này trong 1-2 ngày nữa.

aivivn

@khoapip vì mọi người đang đẩy nhanh tiến độ để hoàn thành cuốn này nên anh merge PR này rồi sửa thêm ở PR khác.

@ngcthuong và @lkhphuc nếu có thời gian thì xem lại phần này một lần nữa nhé. Mình thấy còn nhiều comment của hai bạn chưa được resolve.

update 1

7c63ad6

khoangothe commented Dec 22, 2019

View reviewed changes

khoangothe changed the title ~~update 1~~ Review 47-49 Dec 22, 2019

tiepvupsu reviewed Dec 22, 2019

View reviewed changes

khoangothe and others added 2 commits December 23, 2019 19:29

Update chapters/ch47.md

7baf823

Co-Authored-By: tiepvupsu <[email protected]>

Update chapters/ch47.md

6b7e67a

Co-Authored-By: tiepvupsu <[email protected]>

lkhphuc reviewed Dec 23, 2019

View reviewed changes

khoangothe and others added 5 commits December 24, 2019 09:50

Update chapters/ch49.md

ff783e7

Co-Authored-By: Phúc Lê <[email protected]>

Update chapters/ch49.md

ab84ec9

Co-Authored-By: Phúc Lê <[email protected]>

Update chapters/ch48.md

95c3c5f

Co-Authored-By: Phúc Lê <[email protected]>

Update chapters/ch47.md

56a68d2

Co-Authored-By: Phúc Lê <[email protected]>

Update chapters/ch48.md

2a359ca

Co-Authored-By: Phúc Lê <[email protected]>

ngcthuong reviewed Dec 24, 2019

View reviewed changes

rootonchair reviewed Dec 24, 2019

View reviewed changes

rootonchair mentioned this pull request Dec 24, 2019

Sửa "Phoneme recognizer" thành "Bộ nhận dạng âm vị" trong ảnh #461

Merged

aivivn approved these changes Dec 25, 2019

View reviewed changes

aivivn merged commit 3525026 into mlbvn:master Dec 25, 2019

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Review 47-49 #460

Review 47-49 #460

khoangothe commented Dec 22, 2019

khoangothe Dec 22, 2019

tiepvupsu Dec 22, 2019

tiepvupsu left a comment

tiepvupsu Dec 22, 2019

lkhphuc left a comment

lkhphuc Dec 23, 2019

ngcthuong Dec 24, 2019

rootonchair Dec 24, 2019

lkhphuc Dec 23, 2019

ngcthuong left a comment

ngcthuong Dec 24, 2019

ngcthuong Dec 24, 2019

ngcthuong Dec 24, 2019

ngcthuong Dec 24, 2019

ngcthuong Dec 24, 2019

ngcthuong Dec 24, 2019

ngcthuong Dec 24, 2019

ngcthuong Dec 24, 2019

ngcthuong Dec 24, 2019

ngcthuong Dec 24, 2019

rootonchair left a comment

rootonchair Dec 24, 2019

rootonchair Dec 24, 2019

rootonchair Dec 24, 2019

rootonchair Dec 24, 2019

rootonchair Dec 24, 2019 •

edited

Loading

rootonchair Dec 24, 2019

rootonchair Dec 24, 2019

tiepvupsu commented Dec 25, 2019

aivivn left a comment

	* Những trường hợp hệ âm vị là một biểu diễn khá hợp lý của tiếng nói, chúng cũng có thể giúp thuật toán học hiểu được các thành phần cơ bản của âm thanh và vì vậy cải thiện chất lượng của hệ thống.
	* Trong trường hợp hệ âm vị là một biểu diễn khá hợp lý của tiếng nói, chúng cũng có thể giúp thuật toán học hiểu được các thành phần cơ bản của âm thanh và vì vậy cải thiện chất lượng của hệ thống.

	Giả sử bạn muốn xây dựng một hệ thống để kiểm tra đánh giá phản hồi của sản phẩm trực tuyến và tự động cho biết liệu người viết có thích sản phẩm đó hay không. Ví dụ, bạn muốn hệ thống đó phân loại phản hồi dưới đây là tích cực:
	Giả sử bạn muốn xây dựng một hệ thống để kiểm tra phản hồi đánh giá của sản phẩm trực tuyến và tự động trả về liệu người viết phản hồi có thích sản phẩm đó hay không. Ví dụ, bạn muốn hệ thống đó phân loại phản hồi dưới đây là tích cực:

	1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất[15] .Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn cho tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:
	1. Bộ phân tích cú pháp: Một hệ thống tạo chú thích văn bản trích xuất thông tin từ những từ quan trọng nhất [15]. Ví dụ, bạn có thể sử dụng bộ phân tích cú pháp để tạo nhãn cho tất cả tính từ và danh từ. Từ đó có được đoạn chú thích như sau:

	Cây lau nhà<sub>Danh Từ</sub> này thật tuyệt<sub>Tính từ</sub>!
	Cây lau nhà này<sub>Danh Từ</sub> thật tuyệt<sub>Tính từ</sub>!

	Xu hướng gần đây là thay đổi hệ thống pipeline bởi một thuật toán duy nhất. Một thuật toán đầu-cuối cho tác vụ này chỉ cần nhận vào đoạn văn bản gốc "Cây lau nhà này thật tuyệt!", rồi cố gắng trực tiếp nhận ra cảm xúc từ văn bản gốc đó:
	Xu hướng gần đây là thay đổi hệ thống pipeline bởi một thuật toán duy nhất. Một thuật toán học đầu-cuối cho tác vụ này chỉ cần nhận vào đoạn văn bản gốc "Cây lau nhà này thật tuyệt!", rồi cố gắng trực tiếp nhận ra cảm xúc từ văn bản gốc đó:

	Các thành phần được thiết kế thủ công này giới hạn chất lượng tiềm năng của hệ thống tiếng nói. Tuy nhiên, việc sử dụng các thành phần được thiết kế thủ công cũng có một vài ưu điểm:
	Các thành phần được thiết kế thủ công này giới hạn chất lượng tiềm năng của hệ thống giọng nói. Tuy nhiên, việc sử dụng các thành phần được thiết kế thủ công cũng có một vài ưu điểm:

	* Đặc trưng MFCC có tính kháng tốt đối với một vài thuộc tính không ảnh hưởng tới nội dung của tiếng nói, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp đơn giản hóa vấn đề cho thuật toán học.
	* Đặc trưng MFCC có tính kháng tốt đối với một vài thuộc tính của giọng nói mà không ảnh hưởng tới nội dung, chẳng hạn như cao độ của giọng nói. Bởi vậy, chúng giúp đơn giản hóa vấn đề cho thuật toán học.

	Tuy nhiên, khi tập huấn luyện lớn, nó không bị cản trở bởi giới hạn biểu diễn của MFCC hay hệ âm vị. Nếu thuật toán học là một mạng nơ-ron đủ lớn và được huấn luyện trên dữ liệu đủ lớn, nó có tiềm năng hoạt động tốt và còn có thể đạt được tỉ lệ lỗi tối ưu.
	Tuy nhiên, khi tập huấn luyện lớn, nó không bị cản trở bởi giới hạn biểu diễn của MFCC hay hệ âm vị. Nếu thuật toán học là một mạng nơ-ron đủ lớn và được huấn luyện trên dữ liệu đủ lớn, nó có tiềm năng hoạt động tốt và còn có thể đạt được tỉ lệ lỗi tối ưu.

	Hệ thống học đầu-cuối có xu hướng làm việc tốt khi có nhiều dữ liệu được gán nhãn cho "cả hai đầu" -- đầu vào và đầu ra. Trong ví dụ này, chúng ta cần một tập dữ liệu lớn các cặp (âm thanh, bản ghi). Khi chúng ta không có dữ liệu kiểu này, cần đặc biệt lưu ý khi sử dụng học đầu-cuối.
	Hệ thống học đầu-cuối có xu hướng làm việc tốt khi có nhiều dữ liệu được gán nhãn cho "cả hai đầu" -- đầu vào và đầu ra. Trong ví dụ này, chúng ta cần một tập dữ liệu lớn các cặp (âm thanh, bản ghi thoại). Khi không có dữ liệu kiểu này, chúng ta cần đặc biệt lưu ý khi sử dụng học đầu-cuối.

	Nếu bạn đang làm việc với một bài toán học máy mà tập huấn luyện rất nhỏ, hầu hết các đặc trưng cho thuật toán phải đến từ hiểu biết của con người: Từ các thành phần được "thiết kế thủ công".
	Nếu bạn đang làm việc với một bài toán học máy mà tập huấn luyện rất nhỏ, hầu hết tri thức của thuật toán phải đến từ hiểu biết của con người: Từ các thành phần được "thiết kế thủ công".

	Bài toán về nhận dạng quan điểm tích cực hoặc tiêu cực được gọi là "phân loại cảm xúc". Để xây dựng hệ thống này, bạn có thể tạo một "pipeline" gồm hai phần:
	Bài toán về nhận dạng quan điểm tích cực hoặc tiêu cực được gọi là "phân loại cảm xúc" (_sentiment classification_). Để xây dựng hệ thống này, bạn có thể tạo một "pipeline" gồm hai phần:

	Mạng nơ-ron được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh việc chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn: Thuật toán học nối trực tiếp "đầu vào" và "đầu ra" của hệ thống.
	Mạng nơ-ron được sử dụng phổ biến trong các hệ thống đầu-cuối. Thuật ngữ "đầu-cuối" phản ánh việc chúng ta yêu cầu thuật toán chạy trực tiếp từ đầu vào cho đến đầu ra mong muốn: Thuật toán học nối trực tiếp "đầu vào" với "đầu ra" của hệ thống.

	2. Nhận diện các âm vị: Một số nhà ngôn ngữ học tin rằng trong ngôn ngữ có các đơn vị cơ bản gọi là "âm vị." Ví dụ, âm bắt đầu "k" trong từ "keep" thì phát âm giống âm "c" trong từ "cake". Hệ thống này sẽ cố gắng để nhận diện các âm vị trong các đoạn âm thanh.
	2. Bộ nhận dạng âm vị: Một số nhà ngôn ngữ học tin rằng trong ngôn ngữ có các đơn vị cơ bản gọi là "âm vị." Ví dụ, âm bắt đầu "k" trong từ "keep" thì phát âm giống âm "c" trong từ "cake". Hệ thống này sẽ cố gắng để nhận dạng các âm vị trong các đoạn âm thanh.

	3. Bộ nhận dạng cuối cùng: Dùng các chuỗi âm vị đã được nhận dạng và cố gắng xâu chuỗi chúng với nhau thành một bản ghi thoại ở đầu ra.
	3. Bộ nhận dạng sau cuối: Dùng các chuỗi âm vị đã được nhận dạng và cố gắng xâu chuỗi chúng với nhau thành một bản ghi thoại ở đầu ra.

	Mặc dù phương pháp học đầu-cuối đã đạt được nhiều kết quả tốt, nó không phải luôn luôn là hướng đi tốt nhất. Ví dụ, phương pháp nhận dạng giọng nói đầu-cuối đạt kết quả tốt nhưng tôi không tin tưởng việc sử dụng học đầu-cuối cho xe tự lái. Những chương kế tiếp sẽ giải thích tại sao.
	Mặc dù phương pháp học đầu-cuối đã đạt được nhiều kết quả tốt, nó không phải lúc nào cũng là hướng đi tốt nhất. Ví dụ, phương pháp nhận dạng giọng nói đầu-cuối đạt kết quả tốt nhưng tôi không tin tưởng việc sử dụng học đầu-cuối cho xe tự lái. Những chương kế tiếp sẽ giải thích tại sao.

Review 47-49 #460

Review 47-49 #460

Conversation

khoangothe commented Dec 22, 2019

Nếu bạn tạo Pull Request để dịch, vui lòng hoàn thành các thông tin dưới đây.

Lưu ý

Choose a reason for hiding this comment

Choose a reason for hiding this comment

tiepvupsu left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

lkhphuc left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

ngcthuong left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

rootonchair left a comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

rootonchair Dec 24, 2019 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

tiepvupsu commented Dec 25, 2019

aivivn left a comment

Choose a reason for hiding this comment

rootonchair Dec 24, 2019 •

edited

Loading