Trao đổi với tôi

http://www.buidao.com

1/14/13

[Subtitle] Hướng dẫn trích rút phụ đề tiếng Việt từ DVD

Phim HD download trên mạng không có phụ đề tiếng Việt kèm theo, để xem chung với gia đình, việc lồng phụ đề tiếng Việt là khá quan trọng. Bạn có thể tự làm việc này.

Có một số trang web có thể down được phụ đề tiếng Việt sẵn có như trang subscenes.com, nhưng không phải phụ đề nào cũng có, thậm chí ngay cả khi có, phụ đề đó cũng không đạt chất lượng do dịch ẩu, dịch sai hoặc lỗi chính tả trầm trọng. Trong trường hợp đó, bạn có thể tự làm phụ đề bằng cách tách phụ đề Việt ra khỏi DVD (bán rộng rãi trên thị trường) và sử dụng chúng với những phim HD của bạn.

Có nhiều cách để rút phụ đề bằng các phần mềm khác nhau, trong bài này, tôi xin chia sẻ kinh nghiệm rút phụ đề từ DVD bằng chương trình Subrip.

Để có được chương trình này, bạn có thể search trên net hoặc download trong thread này: http://hdsaigon.com/diendan/showthread.php?t=36

Trước khi tách phụ đề Việt từ DVD, bạn nên copy toàn bộ thư mục VIDEO_TS vào HDD và chương trình Subrip sẽ làm việc với dữ liệu tại thư mục này. Việc này tránh hại đầu đọc DVD và kiểm tra tính toàn vẹn phụ đề tốt hơn.

Sau khi cài đặt, chúng ta khởi động Subrip nào. Bộ ký tự tiếng Việt có nhiều thanh dấu nên khá thử thách đối với các chương trình nhận dạng chữ cái. Vì vậy, trước tiên ta nên config để Subrip tương thích tốt với các đặc điểm của tiếng Việt.



Nếu bạn bỏ qua bước này, phụ đề sẽ mắc một số lỗi chính tả nghiêm trọng và bạn sẽ mất rất nhiều thời gian để chỉnh sửa chúng. Một số khá lớn phụ đề tiếng Việt trên net bị lỗi dấu nặng nghiêm trọng vì được trích rút với thông số default. Các bạn nhập các thông số theo bảng sau:


Đây là các thông số tối ưu mà Chip đã mất khá nhiều thời gian và công sức khi làm hàng trăm phụ đề với đủ loại định dạng và font chữ khác nhau. Rất mong sự góp ý của các bạn nếu có cách config tốt hơn.


Bây giờ thì chúng ta sẵn sàng tách phụ đề ra khỏi DVD.

Nhấn nút VOB để mở file cần tách phụ đề, ta sẽ có bảng sau:


Theo chỉ dẫn, nhất nút "Open IFO"


1. Mở thư mục VIDEO_TS đã copy lên HDD từ trước
2. Chọn file trên hình


Combo box này sẽ liệt kê các phụ đề hiện có trong DVD. Chúng ta cần tách phụ đề nào sẽ chọn phụ đề tương ứng trong đó.

Chú ý: một số DVD không ghi rõ chữ Vietnamese cho phụ đề Việt, trong trường hợp này, chúng ta thử mở từng cái để tìm ra đúng track chứa phụ đề Việt.

Nhấn nút OK, chương trình bắt đầu chạy:


Subrip sẽ quét phim cho đến khi nó tìm được câu phụ đề đầu tiên. Đến đây nó sẽ dừng lại chờ ta ra lệnh:

1. Trước tiên nhấn vào đây để tìm bộ ký tự mẫu sẵn có.
-Nếu Subrip tìm được, nó sẽ thông báo thế này:

khi đó, mọi việc thật đơn giản, ta chỉ việc chờ nó chạy tự động cho đến khi quá trình hoàn tất.

- Nếu Subrip không tìm được, nó sẽ thông báo thế này:

Lúc này, chúng ta phải làm nhiều việc hơn: thiết lập bộ ký tự nhận dạng cho Subrip để có thể dùng trong các trường hợp sau này. Nhấn OK để về lại cửa sổ cũ.



2. Hãy quan sát chữ trên màn hình là gì và nhập vào đúng ký tự nhận diện. Trên hình, là chữ "O" (viết hoa), ta nhập vào "O" và nhấn vào OK. Như vậy chữ "O" đã được lưu vào thư viện của Subrip, lần sau, khi gặp chữ này, nó sẽ tự động biết được để điền ký tự chính xác và không phải dừng lại để hỏi nữa.

Chương trình sẽ tiếp tục chạy, nếu gặp ký tự chưa có trong từ điển của nó, nó sẽ dừng lại và chờ bạn xác nhận. Thường thì khi chạy được 20% bộ phim, hầu như các ký tự đã tương đối đầy đủ, rất ít khi nó phải dừng lại chờ bạn nhận diện ký tự.

Đôi khi hiện tượng dính chữ xuất hiện như trường hợp này:


Quan sát (1): chữ "k" bị dính với dấu huyền nên Subrip không thể nhận diện và chờ ta nhập ký tự tương đương. Tất nhiên là không thể có ký tự nào như vậy trong tiếng Việt. Cách giải quyết là ta bắt Subrip gộp thêm cả chữ "i" vào và được chữ "kì". Để làm được việc này, nhấn vào nút [>>] theo mũi tên (2), khi đó vùng ký tự được chọn sẽ bao gồm cả chữ "kì" như sau:



Cũng có trường hợp dính câu (Subrip không thể tách rời hàng trên và hàng dưới), khi ấy nó sẽ nhờ ta nhập nguyên cả câu:


Trường hợp này cũng có thể áp dụng khi gặp 1 câu bị sai trong DVD, khi ấy ta nhập lại cả câu mà không làm ảnh hưởng đến việc nhận ký tự khác. Để làm được việc này, hãy nhấn nút "Enter manually"

Sau khi phụ đề đã được trích rút 100%, giao diện của subrip như sau:


- (1): hãy chỉnh thông số tại hộp combo này sao cho phù hợp với FPS của DVD, việc này không quan trọng lắm, nhưng với chút may mắn, việc chỉnh phụ đề cho khớp với phim HD sẽ dễ dàng hơn.

- (2): nhấn vào nút này để save phụ đề vừa trích rút vào HDD:


Subrip sẽ hỏi bạn có muốn lưu ở định dạng Unicode hay không, đương nhiên câu trả lời là Yes.

Tới đây bạn đã có file phụ đề mong muốn (unicode) theo định dạng .srt thông dụng. Nhưng công việc chưa kết thúc. Bạn nên lưu lại bộ nhận dạng ký tự mẫu để dùng vào những lần sau. Trước tiên, có thể bạn cần xem lại thông tin bộ ký tự mẫu này và chỉnh sửa chúng một chút nếu cần:


Khi đã ưng ý với bộ ký tự mẫu, bạn save nó xuống HDD, vào thư mục Subrip\ChrMatrix\


Như bạn cũng thấy, Chip đã tạo được kha khá bộ nhận dạng kí tự cho Subrip trong quá trình trích rút hàng trăm DVD từ trước tới nay. Với bộ nhận dạng này, hầu như phụ đề Việt trong phim DVD nào có trên thị trường cũng được nhận dạng chính xác và nhanh chóng. Chip sẵn sàng chia sẻ công trình này cho các bạn thật sự hứng thú và tâm huyết với công việc này.

Khi trích phụ đề từ DVD font chữ, kiểu dáng, kích cỡ của mỗi phim một khác. Các bạn nên tạo 1 bộ nhận dạng riêng cho mỗi hình chữ khác nhau. Việc này rất tiện cho quản lý và giúp kích cỡ bộ nhận dạng nhỏ, chạy nhanh.

Rất mong sự góp ý xây dựng từ các bạn.

Chip - HDsaigon.com
10/7/2008