Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Revise Chương 20-23 #415

Merged
merged 17 commits into from
Dec 8, 2019
Merged

Revise Chương 20-23 #415

merged 17 commits into from
Dec 8, 2019

Conversation

rootonchair
Copy link
Contributor

Nếu bạn tạo Pull Request để dịch, vui lòng hoàn thành các thông tin dưới đây.

  • Đánh dấu [x] (không có dấu cách quanh x) thể hiện dấu tick vào các câu dưới đây cho các câu trả lời 'Có' hoặc 'Đúng'

  • Pull Request này được link tới một issue? Đánh số issue đó ngay sau dấu #: close Revise Chương 20-23 #384

  • Bạn có kiến thức về Học Máy không? Chúng tôi ưu tiên những người có trước kiến thức về Học Máy để việc review được thuận tiện hơn.

  • Bạn đã đọc Bảng thuật ngữ chưa? Bạn cần dịch các thuật ngữ theo bảng thuật ngữ chung.

  • Pull request này đã sẵn sàng cho việc review chưa?

Lưu ý

Chỉ bắt đầu review khi mọi mục trên đây đều đã được tick.

@rootonchair
Copy link
Contributor Author

Một số chỗ mình chưa giải quyết:

  • overfit/underfit/overfitting/underfitting vẫn chưa được dịch
  • "insight" được dịch là "cái nhìn sâu sắc"/"hiểu biết sâu sắc" khá là ... google translate. Mình mong muốn có thể có cách dịch khác phù hợp hơn.

Copy link
Contributor

@tiepvupsu tiepvupsu left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Em sửa lại khá ổn rồi.

Về các từ "fit", "overfitting", "underfitting" em dịch như ở thảo luận kia là được rồi. Mình không nên để cái đó block quá lâu.

Em lưu ý sửa luôn cả từ "regularization" ở các chương khác nữa nhé.

@tiepvupsu
Copy link
Contributor

À anh quên, vì nhiều chương khác cũng đang dùng "fit", "overfit", "underfit" nên em cứ giữ nguyên đã. Khi nào thay thì thay một loạt các từ này.

@rootonchair
Copy link
Contributor Author

Vâng. Mà có một vài chỗ các bạn để luôn là "underfitting" với "overfitting" luôn nên khi nào thay anh kiểm tra luôn các từ này nhé

@tiepvupsu
Copy link
Contributor

n để luôn là "underfitting" với "overfitting" luôn nên khi nào thay anh kiểm tra luôn các từ này nhé

Để anh sang cái issue note lại. Em đừng đóng issue đó nhé.

Copy link
Contributor Author

@rootonchair rootonchair left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

@tiepvupsu em suggest như vầy anh thấy sao?

tiepvupsu
tiepvupsu previously approved these changes Dec 4, 2019
Copy link
Contributor

@tiepvupsu tiepvupsu left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Em có thể merge nhưng cần thay regularization ở các chương khác nữa.

@rootonchair
Copy link
Contributor Author

rootonchair commented Dec 4, 2019

Em có thể merge nhưng cần thay regularization ở các chương khác nữa.

Em nghĩ sẽ để nguyên rồi thay đồng loạt luôn. Thay bây giờ sẽ dễ conflict. Anh đừng merge vội

Copy link
Contributor

@ngcthuong ngcthuong left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Cảm ơn bài dịch của bạn về 4 chương dài ...ngoẵng này. Mình có một vài comments bên dưới bạn tham khảo.

Về cơ bản có một số từ chưa dịch như "clip", từ "chúng ta" nên được dịch là "ta" cho hợp với các chương trước đó. Các từ "bạn" và "của bạn" được dùng khá nhiều mà phần lớn có thể được lược bỏ.

Có sự không đồng nhất về dịch từ "training error" tỉ lệ lỗi huấn luyện (khi có "tỉ lệ, khi không).

Bạn tham khảo nhé.

Cheer :D


> Whereas in the previous chapter we called this a high bias classifier, now we would say that error from avoidable bias is 1%, and the error from variance is about 1%. Thus, the algorithm is already doing well, with little room for improvement. It is only 2% worse than the optimal error rate.

Trong khi ở chương trước chúng ta gọi đây là một bộ phân loại có độ chệch cao, bây giờ chúng ta nói rằng lỗi từ độ chệch có thể tránh được là 1% và lỗi từ phương sai là khoảng 1%. Do đó, thuật toán của chúng ta đã là rất tốt và có rất ít cơ hội cải thiện. Nó chỉ kém đúng 2% so với tỉ lệ lỗi tối ưu.
Trong khi ở chương trước chúng ta gọi đây là một bộ phân loại có độ chệch cao, bây giờ chúng ta nói rằng lỗi từ độ chệch tránh được là 1% và lỗi từ phương sai là khoảng 1%. Do đó, thuật toán của chúng ta đã là rất tốt và có rất ít khoảng trống để cải thiện. Nó chỉ kém đúng 2% so với tỉ lệ lỗi tối ưu.
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Mình thấy từ "khoảng trống để cải thiện" nghe hơi giống tiêng Anh hơn là tiếng Việt.

chapters/ch22.md Outdated

> In the last few chapters, you learned how to estimate avoidable/unavoidable bias and variance by looking at training and dev set error rates. The next chapter will discuss how you can use insights from such an analysis to prioritize techniques that reduce bias vs. techniques that reduce variance. There are very different techniques that you should apply depending on whether your project’s current problem is high (avoidable) bias or high variance. Read on!

Trong một vài chương trước, bạn đã học cách ước tính phương sai và độ chệch có thể tránh được/không thể tránh được bằng cách xem xét tỉ lệ lỗi huấn luyện và phát triển. Chương tiếp theo sẽ thảo luận về cách bạn có thể sử dụng những hiểu biết sâu sắc từ phân tích như vậy để ưu tiên các kỹ thuật làm giảm độ chệch so với các kỹ thuật làm giảm phương sai. Có nhiều kỹ thuật khác nhau nên áp dụng, tuỳ thuộc vào vấn đề hiện tại trong dự án của bạn là độ chệch (có thể tránh được) cao hay phương sai cao. Đọc tiếp!
Trong một vài chương trước, bạn đã học cách ước tính phương sai và độ chệch tránh được/không tránh được bằng cách xem xét tỉ lệ lỗi huấn luyện và phát triển. Chương tiếp theo sẽ thảo luận về cách bạn có thể sử dụng những hiểu biết sâu sắc từ phân tích đó để ưu tiên các kỹ thuật làm giảm độ chệch hoặc các kỹ thuật làm giảm phương sai. Có nhiều kỹ thuật khác nhau nên áp dụng tuỳ thuộc vào vấn đề hiện tại trong dự án của bạn là độ chệch (tránh được) cao hay phương sai cao. Hãy đọc tiếp!
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Trong một vài chương trước, --> một vài chương gần đây
  • "ước tính" --> tính
  • "xem xét tỉ lệ lỗi huấn luyện và phát triển. " --> xem xét tỉ lệ lỗi huấn luyện và tỉ lệ lỗi phát triển.

Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Hãy đọc tiếp ---> Hồi sau sẽ rõ.

@rootonchair
Copy link
Contributor Author

Có sự không đồng nhất về dịch từ "training error" tỉ lệ lỗi huấn luyện (khi có "tỉ lệ", khi không).

Mình có kiểm tra và sửa những chỗ không đồng nhất như vậy. Có thể từ "tỉ lệ" bạn gặp là từ "training error rate"

Còn phần comment thì ... để mình đọc dần 😅 . Thank bạn

Copy link
Collaborator

@aivivn aivivn left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Anh yêu cầu sửa ở tài khoản này phòng khi ai đó lỡ ấn nhầm nút merge :D.

Copy link
Contributor

@ngcthuong ngcthuong left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Bản dịch khá hoàn thiện. Mình chỉ góp ý thêm một vài lỗi nhỏ và cần update từ khóa "overfitting" như thảo luận ở trên.

rootonchair and others added 6 commits December 6, 2019 12:27
@ngcthuong
Copy link
Contributor

Mình tưởng là thống nhất cập nhật từ khóa "overfitting" rồi chứ nhỉ?

@rootonchair
Copy link
Contributor Author

Theo anh Tiệp thì nên để lại rồi sửa đồng loạt luôn vì các chương khác cũng có từ này

Copy link
Contributor

@ngcthuong ngcthuong left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Vậy thì ổn rồi. mình sẽ approve bản dịch này. Cảm ơn em.

@aivivn
Copy link
Collaborator

aivivn commented Dec 8, 2019

Theo anh Tiệp thì nên để lại rồi sửa đồng loạt luôn vì các chương khác cũng có từ này

@rootonchair em có thể giúp sửa đồng loạt các chương được không?

@aivivn aivivn merged commit d48bb7c into mlbvn:master Dec 8, 2019
@rootonchair rootonchair deleted the vinh-review-20to23 branch December 9, 2019 02:01
@rootonchair
Copy link
Contributor Author

@aivivn Anh có thể tạo issue và nêu yêu cầu. Em sẽ nhận

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

Revise Chương 20-23
4 participants