Trao đổi với tôi

http://www.buidao.com

1/10/14

[HD phim] Bạn biết gì về Raid - Raid dưới góc nhìn của người sử dụng HD

Bạn thực sự biết gì về RAID? RAID có phải là backup không? Nói về bảo vệ dữ liệu thì RAID có thực sự là công cụ bảo vệ kho dữ liệu HD của bạn một cách hiệu quả hay không? Bạn hãy cùng tôi thử tìm hiểu về RAID đứng dưới góc độ của dân chơi HD xem nó như thế nào nhé.




Khi nói đến việc bảo vệ dữ liệu, người ta thường nghĩ đến việc backup dữ liệu và rồi điều đầu tiên mà bạn hay liên tưởng ngay đến đó là RAID. Tôi cũng xin thưa ngay từ đầu – backup không phải là RAID. Có chăng chúng dính dáng nhau một chút trong mục đích bảo vệ dữ liệu mà thôi, còn ngoài ra thì chúng hoàn toàn khác nhau.

Trước tiên tôi xin nói một chút về backup (hai chữ backup luôn viết liền nhau) là gì.
Backup là quá trình sao chép và lưu trữ dữ liệu máy tính để nó có thể phục hồi về bản gốc tại thời điểm trước khi có sự cố mất mát dữ liệu. Xin xem thêm bài viết “Tôi đã bảo vệ dữ liệu của mình như thế nào” để biết về mất dữ liệu là như thế nào. Backup có 2 mục đích rõ ràng:

Thứ nhất, phục hổi các dữ liệu bị mất (vì bất cứ lý do gì).
Thứ hai, phục hồi dữ liệu về trạng thái tại một thời điểm trước đó mà mình muốn.

Bởi vì, như định nghĩa nói, hệ thống sao lưu chứa ít nhất một bản sao của tất cả các dữ liệu quý giá mà nó copy được nên yêu cầu về nơi lưu trữ dữ liệu là rất quan trọng. Việc tổ chức nơi có đủ dung lượng lưu trữ cũng như việc quản lý sao lưu sao cho hiệu quả là cả một quá trình phức tạp. Và chính điều này đã tạo ra sự khác biệt đáng kể so với RAID.

Để được gọi là backup đúng nghĩa nó phải đáp ứng 2 tiêu chí: Offline và offsite.

Offline – Quá trình backup được thực thi cũng như bản backup phải nằm ngoài hệ thống mà nó đang sao lưu dữ liệu. Nói cách khác bình dân cho dễ hiểu. Dữ liệu được sao lưu nằm ở một máy, còn backup phải chạy trên máy khác. Chứ nếu không giả sử như thằng PSU nó chết thì không nói, nghe lời bạn bè làm viên thuốc lắc khiến nó cà giựt làm điện trồi sụt rồi toi cả đám hdd vừa dữ liệu vừa backup thì ta chỉ có nước cắn lưỡi.

Offsite – Máy chạy backup phải nằm ngoài khu vực các máy chủ mà nó đang backup dữ liệu như khác lầu, khác building và nói chung càng xa càng tốt. Việc này nhằm tránh các tình huống thiên tai địch họa cháy nổ làm sụp toàn hệ thống một lúc.

Nhìn chung backup thường được áp dụng cho các doanh nghiệp lớn, nhà băng, cơ quan nhà nước những nơi có những dữ liệu nhiều và quan trọng cần phải bảo vệ (vấn đề bảo mật dữ liệu nằm ngoài phạm vi bài này). Tôi có làm việc với một vài đồng nghiệp (chung công việc nhưng khác bộ phận). Họ phụ trách việc sao lưu và lưu trữ dữ liệu thông tin của cả quốc gia. Mỗi lần làm backup xong (với các dữ liệu đặc biệt quan trọng nhưng không thay đổi thường xuyên), tôi thấy họ có các nhân viên vũ trang đưa xe bọc thép chở các tape dữ liệu vào các hầm chứa ở một nơi ít người được phép biết để cất giữ. Sau này vì lý do an ninh, họ xây hẳn một trung tâm backup và backup qua hệ thống network cáp quang nội bộ (fiber cables 10Gb). Dĩ nhiên backup còn rất nhiều điều lý thú khác như các mức độ backup, các hình thức backup, các phương tiện backup, các vấn đề về nén dữ liệu, encryption, …. Một lần nữa nó lại nằm ngoài phạm vi bài viết nên ai có hứng thú, thì sẽ trao đổi thêm sau.
Tôi cố tình nói hơi kỹ về backup để chúng ta có thể hiểu và sau này dễ dàng phân biệt với Raid.

Ưu điểm của backup thì hầu như ai cũng biết rồi, vậy những điểm yếu của nó là gì?

- Tốn kém thiết bị lưu trữ. Thật vậy, nếu bạn có 1TB mà muốn backup nó thì phải có 1TB nữa để chứa (backup) cái 1TB gốc. Có nén lắm cũng chỉ tiết kiệm chút đỉnh, mà càng nén nhiều thì tỉ lệ thất bại khi giải nén trong quá trình restore càng cao, do đó càng hồi hộp, nguy hiểm.
- Thời điểm backup bị hạn chế. Khi chúng ta phục hồi dữ liệu thì đó chính là dữ liệu tại thời điểm mà chúng ta làm backup mà thôi. Còn các thay đổi dữ liệu ngay sau khi backup được thực thi sẽ không được lưu giữ lại (cái này quan trọng và nên nhớ).
- Thời gian thực hiện backup thường kéo dài so với Raid (thời gian thực).
- Phiền phức, tốn kém thêm khi lưu trữ các backup.

Trở về đề tài chính đó là RAID. Ai cũng biết RAID là tên viết tắt của Redundant Array of Inexpensive Disks hoặc sau này nghe kỹ thuật hơn là Redundant Array of Independent Disks.
Theo trang tài liệu Wiki, Raid lần đầu tiên được phát triển bởi các nhà khoa học máy tính thuộc trường Đại học California tại Berkeley vào năm 1987. Mục đích ban đầu là họ muốn kết hợp hai hoặc nhiều ổ đĩa cứng vật lý để rồi sau đó tạo ra một thiết bị lưu trữ ảo duy nhất trên hệ thống máy chủ. Nói khác đi, OS của máy chủ lúc này chỉ có thể thấy một ổ duy nhất được dựng từ 2 hay nhiều HDD có trong máy.





Qua quá trình nghiên cứu và sử dụng, phương pháp mới này được bổ sung làm cho nó có thêm 2 khả năng hay hơn so với một ổ HDD đơn độc thông thường.

Thứ nhất: Giải quyết được lỗi hỏng hóc của một (sau này là nhiều hơn) ổ HDD trong RAID.

Thứ hai: tăng hiệu suất đọc/ chép trên RAID.

Nói cách khác, RAID được cải tiến nhằm giúp tăng khả năng chịu lỗi và nâng mức thông lượng I/O throughput cao hơn so với một ổ cứng duy nhất hoặc một nhóm các ổ đĩa cứng độc lập.

Nhớ hồi xưa khi tập làm quen với máy tính, nghe tới Raid ai cũng xanh mặt run tay vì tính chất lưu trữ phức tạp và tương đối đặc biệt của nó. Ngày nay tôi chắc là phần nhiều trong chúng ta nếu cứng tay một chút thì chí ít cũng một vài lần set up một cái Raid cho riêng mình, đặc biệt là khi mức độ lưu trữ ngày càng được nâng lên về dung lượng và cần thiết cho một loạt các ứng dụng client / server.


Có hai khái niệm chính mà ta nên nhớ khi nói về Raid.

1/ Parity

Yếu tố cơ bản để giúp cho ta có thể phục hồi dữ liệu trực tuyến (tức lúc máy chủ vẫn đang vận hành) trong trường hợp một đĩa cứng bị hư hỏng bằng cách sử dụng một hình thức dự phòng được gọi là parity. Để nói cho bình dân đơn giản hơn , parity là phần bổ sung của tất cả các ổ đĩa được sử dụng trong cái Raid đó. Khi ta muốn tạm đọc dữ liệu từ một HDD bị hư nào đó (tôi nói tạm là vì khi ấy tốc độ truy xuất dữ liệu của toàn mảng Raid sẽ rất chậm, chúng chỉ được phục hồi tốc độ khi đã được thay bằng một ổ cứng mới), Raid sẽ thực hiện bằng cách đọc các dữ liệu tốt còn lại và kiểm tra nó bằng cách đối chiếu lại với dữ liệu pairty được lưu trữ trong mảng.

Tôi lấy ví dụ đơn giản để các bạn đễ hình dung Raid đã tính parity như thế nào.
Giả sử ta có 4 ổ cứng tạo nên Raid và lần lượt các ổ cứng này chứa các dữ liệu mang giá trị cũng lần lượt là 1, 2, 3, và 4. Khi đó Raid sẽ gán giá trị của parity là 10 (giả sử thôi chứ thực tế không phải vậy đâu)
1 + 2 + 3 + 4 = 10
Khi ổ thứ 3 bị toi thì ta sẽ có
1 + 2 + X + 4 = 10
Để biết cái ổ cứng thứ 3 trước đó có chứa dữ liệu gì, khi đó Raid sẽ tính
7 + X = 10 hay X = 10 -7 hay X = 3.
Cũng vì tính toán dài dòng như vậy nên, nếu các bạn để ý, khi một ổ bị tèo trong Raid 5 chẳng hạn, đồng ý là vẫn không có một dữ liệu nào bị mất, nhưng tốc độ truy xuất bị chậm hẳn đi.

Lưu ý parity chỉ được sử dụng ở các cấp độ RAID 2 , 3, 4 , và 5.
RAID 1 không sử dụng parity bởi vì tất cả dữ liệu là hoàn toàn sao chép ( nhân đôi).
Còn RAID 0 chỉ được sử dụng để tăng hiệu suất truy xuất. Vì không trang bị chức năng dự phòng dữ liệu nên nó không có parity .

Một câu hỏi gợi mở đối với các bạn nè. Các bạn đã bao giờ set up một cái Raid 5 trên Windows hay Linux chưa? Nếu có thì có bao giờ gặp một trường hợp là 1 ổ cứng bị hư chưa? Khả năng thành công khi phụ hồi dữ liệu trở lại (sau khi thay ổ cứng mới) là bao nhiêu phần trăm?


2/ Khả năng chịu lỗi hỏng hóc ổ cứng

Ngày nay người ta vẫn còn đang tranh luận gay gắt liệu công nghệ RAID có thật sự bảo vệ dữ liệu hay không? Có ngăn ngừa các lỗi hư ổ đĩa không. Gần đây thôi trên diễn đàn này cũng có vài ý kiến bài bác thẳng thừng Raid. Ví dụ như ở Raid 5, nếu chẳng may có từ 2 ổ cứng rù nhau cùng về chầu Diêm vương thì toàn bộ dữ liệu chết sạch, không cách gì cứu vãn được. Theo ý kiến cá nhân, thì tôi cũng cho là Raid không bảo vệ dữ liệu hoàn hảo như backup, nhưng.... Vâng nhưng RAID cung cấp sự bảo hiểm an toàn nhất định khi nó có thể chống đỡ sự hỏng hóc của ổ đĩa (nhiều hay í thì còn tùy loại Raid) bằng cách cho phép kéo dài thời gian để phục hồi dữ liệu.
Các khả năng chịu lỗi của các Raid cũng có thể được tăng cường đáng kể bằng cách chọn loại Raid lưu trữ đúng đắn (sẽ nói ở sau).

Ở trên ta đã biết parity được Raid tạo ra và tính toán ra sao, thì khi nhìn vào cách phân bố parity trong một Raid, ta có thể biết khả năng chịu lỗi hỏng hóc HDD của Raid đó dư lào ngay, ví dụ:

- Raid 5, các phần tử parity Ap, Bp, Cp, Dp,... được phân bố tuần tự lần lượt trên từng HDD trong Raid. Nếu cộng tất cả lại ta sẽ thấy chúng chiếm vừa đứng dung lượng (nhỏ nhất) của một ở cứng trong Raid đó. Đó là lý do tại sao ta thấy ở các Raid 5, chúng ta phải hy sinh 1 ổ cho Raid và Raid thường bắt (hay nói đúng hơn nó chỉ bảo kê) chúng ta sử dụng các HDD có cùng dung lượng. Thằng HDD nào lớn chuẩn sẽ bị nó vạc bớt ráng chịu. Và cũng từ đây ta có thể biết rằng, trong Raid 5, nó chỉ cho phép 1 HDD toi mạng mà thôi, còn hơn nữa thì khi đó chính người dùng ... toi mạng.





- Raid 6, cũng tương tợ như Raid 5 thôi, nhưng lần này ta để ý thấy có xuất hiện thêm Aq, Bq, Cq, Dq,... mà nếu ngồi cộng tổng chúng lại sẽ vừa bằng 2 HDD trong Raid. Vâng giống như trên, ta biết dung sai cho phép hard drive chết tối đa chỉ là 2 thôi. Dễ ẹt phải không các bạn?





Vì đề tài về Raid rất rộng, trong bài này tôi không thể nói cụ thể Raid là gì, nguyên lý họat động của nó ra sao, có mấy cấp độ Raid và chúng khác nhau thế nào, hy vọng đến đây bạn vẫn chưa bị “bơi”. Mà muốn biết có đang bị “bơi” hay không dễ lắm. Nếu bạn trả lời được những câu hỏi này thì bạn có thể an tâm đi tiếp phần còn lại của bài:

Backup và Raid 1 giống và khác nhau ở điểm nào?
Tại sao nói Raid ngày nay có khả năng chịu được mức độ hư hỏng của một đến vài ổ cứng trong mảng Raid?
Cái gì làm cho Rai có khả năng đọc/ chép nhanh hơn là các ổ cứng độc lập?


Các yếu tố làm gia tăng sự phát triển của Raid trong giai đoạn hiện nay

Ngày nay ngày càng có nhiều công ty lớn đã tạo ra những mạng lưới nội bộ riêng cho mình trên toàn doanh nghiệp để nâng cao năng suất và sắp xếp luồng thông tin. Trong khi đó thì các cơ sở dữ liệu lại được lưu trữ phân tán trên các máy chủ riêng rẽ. Bằng cách kết hợp nhiều ổ đĩa vào một mảng duy nhất - được xem bởi các hệ điều hành mạng như một ổ đĩa duy nhất, ứng dụng Raid gom về một kho dữ liệu duy nhất trên mạng, nó cung cấp lợi ích đáng kể là giảm chi phí , các khoản tiết kiệm có thể được, đồng thời nhanh chóng phục hồi nếu thông tin thường xuyên bị mất hoặc không thể truy cập.

Các bạn cũng biết, các ứng dụng hiện nay tạo ra các tập tin lớn hơn do đó nhu cầu lưu trữ mạng đã tăng lên tương ứng. Ngoài ra, sự tăng tốc của tốc độ CPU đã vượt xa tốc độ truyền tải dữ liệu để lưu trữ, tạo ra tắc nghẽn trong hệ thống hiện nay. Vì thế giải pháp lưu trữ RAID vượt qua những thách thức này bằng cách cung cấp một sự kết hợp của tính sẵn sàng dữ liệu , hiệu suất nổi bật, khả năng mở rộng, năng suất cao và phục hồi mà không làm mất dữ liệu hoặc gián đoạn truy cập của người dùng.


Các loại RAID

Các bạn biết hiện nay có bao nhiêu loại Raid không? Có người sẽ nhau nhẩu nói ngay Raid 0, Raid 1, Raid 5, v.. v… Không phải bạn ơi, đó chỉ là cấp độ Raid mà thôi và tùy theo nhu cầu lưu trữ và sử dụng mà người ta quyết định chọn lựa cho mình cấp độ Raid nào cho phù hợp.
Còn Raid hiện nay thì tựu chung có 3 loại: Software RAID, Fake RAID và Hardware RAID.
Như đã nói, RAID là mảng đề tài quá lớn, quá rộng, nếu mà nói cho hết, cho đủ thì có lẽ bài viết sẽ phải kéo dài lê thê. Do đó, tôi chỉ nói tóm gọn đặc điểm của từng loại RAID này là gì để sau này bạn cũng có cái cơ sở để phân biệt, không bị người khác chê… ‘Hai lúa”!
Các bạn nên nhớ một điều cho dù là loại RAID gì, chúng đều có chung một đặc điểm là chạy trên các mã RAID viết dựa trên phần mềm. Sự khác biệt giữa các loại RAID là nơi mà các mã phần mềm này được thực thi hoặc trên bộ xử lý (CPU) máy chủ (như software RAID, Fake RAID ) hoặc ‘bán cái’ lại cho một bộ xử lý on-board ( Hardwar RAID).


1/ Software RAID

Cái này thì dễ rồi, sau khi cài xong HĐH, bạn tiến hành dùng luôn Windows để thiết lập RAID (0, 1, 5, gì đó) tùy ý bạn muốn – Windows based RAID. Còn bạn nào sử dụng Linux thì có sẵn mdadm utility không cần suy nghĩ nhiều cho nặng đầu. Ngày nay, đã và đang có khá nhiều software RAID được viết trên nền Linux và ngày càng chứng tỏ khả năng vượt trội so với hai anh kia. Chỉ gói gọn trong một câu như thế này, tôi không nghĩ các bạn sẽ hiểu hết. Vì sự hạn chế độ dài của bài, nên tôi chỉ có thể nói ngắn là basic RAID sẽ dần chết và bị thay thế bởi các software RAID viết dựa trên các mã nguồn mở.
Các software RAID dựa trên phần mềm chủ yếu được sử dụng với các máy lưu trữ gia đình, các máy chủ entry-level . Điểm chủ yếu để nhận diện là nó thực hiện tất cả các lệnh I / O và các thuật toán toán học RAID chuyên sâu trực tiếp trên các CPU của máy chủ lưu trữ. Chính điều này làm chậm hiệu suất hệ thống bằng cách tăng lưu lượng truy cập máy chủ qua PCI bus , sử dụng vào ngay luôn tài nguyên của hệ thống CPU, memory, .... Ưu điểm chính của software RAID là giá thành rẻ hơn (nhiều software RAID cho free luôn) so với các lựa chọn thay thế RAID khác như hardware RAID có mức giá cao hơn nhiều.

2/ Fake RAID hay Host RAID

Tôi không hiểu lắm tại sao người ta lại nói là fake RAID, mà nếu dịch ra tiếng Việt cho sát nghĩa thì nghe nó trớt quớt. Trong khi tôi ưa thích từ Host RAID vì nó sát thực tế hơn. Vậy Fake RAID (RAID giả) là gì?
Tôi chắc rằng có 80 – 90% trong số các bạn không biết gì về nó, thậm chí mới nghe lần đầu trong khi mình xài nó hà rầm mỗi ngày.
Khi bạn mới mua một cái mainboard mới toanh về, trong lúc cài Windows, ta nhấn F6 để cài driver (chắc các bạn vẫn còn nhớ) nhằm để thiết lập RAID trong BIOS bên ngoài Windows. Rõ ràng đâu có gì dính đến software nào đâu vì ngay cả OS còn chưa có huống là. Do đó nó rõ ràng là hardware RAID (hardware là motherboard đó!)
Cũng vậy, khi bạn mới mua một cái card Sata rời 4 hoặc 8 cổng Sata. Ta set up RAID trên những ổ cứng gắn trên nó và cũng chả có cái software tên là A hay B nào can thiệp vào đây. Vâng, rõ ràng nó cũng chính là một hardware RAID.
Không phải thật sự như vậy đâu các bạn ạ. Một lần nữa ta phải bám chắc vào một nguyên lý đơn giản nhưng cơ bản là: Cho dù cái RAID đó được hình thành (xuất sứ) từ đâu một khi nó vẫn còn sử dụng nguồn tài nguyên là chính cái CPU và bộ nhớ memory của máy chủ để hoạt động (tính toán RAID, truy xuất dữ liệu,...) thì nó vẫn bị coi là software RAID như thường. Tuy nhiên vì ở đây nó có liên quan chút đỉnh tới mobo hoặc card rời. Nó sử dụng firmware nhận diện/ đánh giá ổ cứng trước khi HĐH được khởi động. Và sau khi HĐH khởi động xong (lấy quyền kiểm soát lại từ Bios) thì khi đó nó giao quyền điều khiển RAID cho OS luôn. Vì lẽ đó mà nó có tên gọi Host RAID là vậy. Trời, khó quá, thế thì như thế nào mới được gọi là hardware RAID, mặt mũi nó như thế nào?


3/ Hardware RAID

Nó thường ở dưới hình thức là một dạng card add-in. Loại card RAID controller này cắm vào một khe cắm bus chủ PCI. Giảm tải hệ thống máy chủ trong một số hoặc tất cả các lệnh I / O, dành các hoạt động tính toán RAID cho một hoặc nhiều bộ vi xử lý thứ cấp mà nó có.
Ngoài việc cung cấp những lợi ích chịu lỗi của một RAID thông thường , bộ điều khiển hardware RAID còn thực hiện các chức năng kết nối tương tự như bộ điều khiển trên máy chủ tiêu chuẩn. Và cũng bởi nhờ nó có riêng cho mình tài nguyên (CPU, memory,...) , nên chúng thường cung cấp hiệu suất cao nhất cho tất cả các loại RAID. Hardware RAID cũng cung cấp tính năng chịu lỗi mạnh mẽ hơn đa dạng hơn software RAID. Ví dụ như RAID 0/1/5/6/10/50/60. Thế bạn thường gặp hardware RAID ở đâu? Có phần nhiều các bạn sẽ ít có cơ hội mua chúng vì giá quá chát hoặc thấy chúng (vì thường được trang bị để xây dựng các siêu hệ thống lưu trữ dung lượng cao nơi các máy chủ cao cấp) .
Theo tôi biết, vài cái tên nổi tiếng được các tay có máu mặt trang bị cho các file servers tại gia là 3ware, Areca, Intel, LSI vì chúng đem lại hiệu suất thực sự. Còn giá thì vô chừng từ vài trăm đến cả ngàn USD tùy theo con chip đi theo nhanh hay chậm, dung lượng memory tích hợp, số cổng Sata có thể kết nối, v..v...
Ví dụ như em này

3ware 9650SE-8LPML PCI Express SATA II Controller Card RAID




Tóm lại, đứng dưới góc nhìn của dân lưu trữ HD, khi mà dung lượng phim ảnh nhạc nhẽo ngày càng phình to ra thì nhu cầu tìm hiểu về RAID để trợ giúp cho việc lưu trữ trở nên một chủ đề nóng và nó quan trọng hơn bao giờ hết.
Đáng tiếc bài này không thể dài hơn nên chỉ cho ta một cái nhìn tổng quan bao gồm tất cả hóa thân của RAID thôi chứ không bao gồm chiều sâu trong chúng. Một đều an ủi là, chí ít qua bài này, bạn hiểu được phần nào về RAID để từ đó có quyết định đúng đắn khi lựa chọn một phương pháp bảo vệ cho kho lưu trữ dữ liệu HD của mình.

Thanksforsharing@HDVietnam

[System Info] Phần 2 - Tôi đã bảo vệ hệ thống lưu trữ dữ liệu HD của mình như thế nào

Ngày nay, khi mà khối lượng thông tin của con người ngày càng nhiều về lượng, phong phú về nội dung, đa dạng về hình thức thì nhu cầu về lưu trữ và đặc biệt là bảo vệ chúng cũng càng trở nên cấp thiết và nóng không kém. Hãy tưởng tượng một công ty đầu tư nước ngoài vào làm ăn ở Việt Nam, cuối năm kết toán sổ sách báo cáo về công ty mẹ xem lời lãi như nào. Nhưng rủi thay dữ liệu bị mất hết thì Giám đốc công ty có đáng đem ra trảm không? Rồi ăn nói sao với cơ quan thuế vụ? Càng vi tính hóa (paperless) thì càng chết nhiều. Còn riêng với anh em HD thì nhu cầu bảo vệ phim, nhạc, dữ liệu như thế nào thì có lẽ tôi không cần nhắc lại.




1/ Mất dữ liệu

Trước khi đi vào phần chính – phần bảo vệ dữ liệu HD, tôi nghĩ các bạn cũng cần nên biết một chút về thế nào là mất dữ liệu. Vì có biết về mất dữ liệu thì mới biết cách bảo vệ dữ liệu cho đúng đắn và hiệu quả. Cũng như khi ra trận đánh giặc thì phải biết giặc là ai thì mới đánh được chứ, chả nhẽ đánh vào không khí à? Có người nói tôi rườm rà, dài dòng, nhưng tính tôi nó thế. Khi làm thì phải biết mình đang làm cái gì, kết quả ra sao. Còn như không biết thì không làm, chứ không theo kiểu Thiên Lôi ai sai đâu đánh đó. Mong các bạn thông cảm.

Mất dữ liệu được xem là một tình trạng lỗi trong các hệ thống thông tin mà ở đó các dữ liệu bị mất sạch, không còn được truy xuất được nữa. Điều này xảy ra có thể trong quá trình thực thi tác vụ, truyền tải hoặc lưu trữ.





Ta phải cần phân biệt một điều là mất dữ liệu nó khác với trường hợp dữ liệu không sẵn sàng để sử dụng. Ta lấy ví dụ khi bạn đang xem phim qua Youtube giữa chừng thì bị đứt mạng. Bạn có thể truy cập được dữ liệu để coi tiếp không? Dĩ nhiên là không rồi, nhưng bạn có cho rằng bị mất dữ liệu không hay chỉ tạm thời thôi rồi khi nào nối mạng lại thì xem được tiếp?

Mặc dù cả hai trường hợp trên đều cho những hậu quả tương tự cho người dùng, tức không truy xuất được dữ liệu, nhưng dữ liệu không sẵn sàng chỉ mang tính là tạm thời, trong khi mất dữ liệu có thể được coi là mất vĩnh viễn.

Ngoài ra còn một trường hợp mất dữ liệu nữa mà ta thường hay nghe, đặc biệt trên các báo đài. Mất dữ liệu ở đây thật ra không phải là người chủ dữ liệu đó bị mất (vẫn còn nguyên vẹn trong tay ấy chứ) mà là các dữ liệu (nhạy cảm ấy) bị hack cho bên thứ 3 biết. Thiệt hại từ sự cố này cũng đáng kể chứ chẳng chơi. Ví dụ như dữ liệu nhạy cảm về công nghệ chế tạo máy bay tàng hình không người lái tác chiến trên tàu sân bay của Mỹ mà rơi vào tay nước “lạ” xem, chuyện sẽ không nhỏ đâu. Hoặc như các dữ liệu về hợp đồng mua bán thậm thụt với nước ngoài bị mất vào tay các phương tiện truyền thông xem, sẽ có khối anh Giám đốc vào nhà đá gỡ lịch hoặc về nhà đuổi gà cho vợ.

Các loại mất dữ liệu

Do hành động cố ý: Các dữ liệu bị xóa với sự chủ ý của người dùng.
Do hành động vô ý: gồm
- Tình cờ xóa một tập tin hoặc chương trình.
- Thất lạc phương tiện lưu trữ như ổ cứng, tape, đĩa CD hay thẻ nhớ
- Quản trị dữ liệu tồi
- Không đọc được dữ liệu chứa trong các định dạng lạ

Lỗi hư hỏng

- Mất điện , dẫn đến dữ liệu trong bộ nhớ tạm không được lưu kịp thời vào nơi lưu trữ lâu dài.
- Lỗi phần cứng, chẳng hạn như một vụ tai nạn của đầu đọc trong một đĩa cứng.
- Lỗi phần mềm bị sụp hoặc bị treo dẫn đến dữ liệu cũng không được lưu đúng đắn.
- Phần mềm bị lỗi trong quá trình viết hoặc khả năng sử dụng kém , chẳng hạn như không xác nhận lệnh xóa một tập tin.
- Dữ liệu tự nó bị hư hỏng ngầm – Xin xem về bài viết nói về Data Rot.

Các thảm họa

- Thiên tai, động đất, lũ lụt, lốc xoáy, v..v...
- Lửa

Tội phạm

- Trộm cắp, đột nhập, phá hoại, v..v...
- Các hành động ác ý chẳng hạn như lén lút thả virus, worm, và hacker cũng như hành động trộm cắp các phương tiện lưu trữ vật lý.

Tóm lại, trong một nghiên cứu được đăng trên Wiki cho thấy lỗi phần cứng và lỗi của con người là hai nguyên nhân phổ biến nhất gây mất mát dữ liệu, nó chiếm khoảng ba phần tư của tất cả các sự cố mất dữ liệu. Nguyên nhân nữa làm mất dữ liệu là các thảm họa tự nhiên. Tuy nhiên khả năng mất dữ liệu do thảm họa tự nhiên là nhỏ. Cách duy nhất để chuẩn bị cho một biến cố thương đau là mất dữ liệu, tôi và các bạn không biết phải làm gì hơn là chủ động chọn cho mình một phương pháp hữu hiệu nhằm bảo vệ lấy nhưng dữ liệu yêu quý của mình đã dày công sưu tầm trong bằng ấy năm nay.


2/ Chọn lựa phần mềm – Software

- Bám vào các tiêu chuẩn khi chọn lựa: So với việc chọn lựa phần cứng đòi hỏi sự tỉ mỉ cẩn thận ở bài 1, thì việc chọn lựa phần mềm ở đây khá đơn giản. Tuy nhiên nó vẫn không kém phần quan trọng. Cũng giống như ở phần cứng, ta vẫn phải bám chặt lấy những tiêu chuẩn được đề ra ngay từ đầu. Tôi lấy vì dụ tại sao nó quan trọng. Tiêu chuẩn đề ra là khi nghe nhạc hoặc xem phim thì một ổ cứng và chỉ có một ổ cứng làm việc thôi, những cái còn lại phải ở trong trạng thái nghỉ. Nếu như tôi chọn standard RAID 5 thì coi như phá sản rồi chứ gì nữa?!?!

- Ngoài ra, do tính chất đặc thù của một hệ thống chỉ chuyên lưu trữ dữ liệu, nên ta cố gắng càng ít cài các loại phần mềm vớ vẩn càng tốt. Chủ yếu nhằm tiết kiệm tài nguyên hệ thống, máy khởi động được nhanh, ngoài ra còn nhằm tránh các trường hợp xung đột phần mềm không đáng có.

Hệ Điều Hành

Dĩ nhiên rồi vì hệ thống lưu trữ nào mà không cần nó. Bạn có thể dùng HĐH Windows hay Linux (2 loại thông dụng hiện nay dành cho lưu trữ) là tùy nhu cầu, điều kiện và sở thích của bạn. Tôi chọn Windows vì sự phổ dụng của nó đối với người dùng gia đình. Ngoài ra nếu mình bị bí thì chạy lên mạng hỏi sẽ dễ được trả lời hơn. Giả dụ như tôi “lúa” không biết cách mount ổ cứng thì trong Windows sẽ có nhiều người biết và dễ dàng chỉ cho tôi so với Linux. Hay cái ổ cứng đã được format ở NTFS, thì khi nhổ phăng từ máy chủ có thể đem đi cắm vào bất cứ máy dùng HĐH Windows, khỏe re như bò kéo xe, khỏi lăn tăn suy nghĩ cách đổi định dạng. Đó là tôi đang nói chúng ta – những người dùng gia đình thôi. Còn đối với các doanh nghiệp lớn, lượng thông tin lưu trữ nhiều theo tôi biết ít ai dám can đảm như chúng ta mà dùng Windows lắm. Một điều dễ thấy là hệ điều hành mở quản lý dữ liệu mạnh mẽ và bảo mật hơn Windows nhiều lắm luôn và vì không thuộc phạm trù bài viết này nên tôi không tiện nói nhiều.

Đồng ý là Windows rồi nhưng mà là Windows gì? Theo kinh nghiệm cá nhân tôi thì dùng Windows nào cũng được. Từ Vista, 7, 8 cho đến Server Essential (thay thế cho WHS 2011), 2K3, 2K8, hay 2012. Nhưng ổn định nhất (mà tôi cũng thấy nhiều người đang sử dụng là Windows 7 và Windows Server 2012). Tôi hiện đang dùng Server 2012 (vì cho nó giống như mấy cái server của tôi ở chỗ làm ..hì..hì..)

Nếu bạn để ý thì sẽ thấy từ đầu đến giờ tôi phần nhiều hay dùng từ ‘hệ thống’ này ‘hệ thống’ nọ thay vì nói server cho nó gọn. Chỉ là một cái máy lưu trữ thôi chứ có gì đồ sộ lằng nhằng ghê gớm gì đâu mà dùng từ đao to búa lòe thiên hạ? Đó là do tôi đã tính trước sợ các bạn sẽ bối rối hỏi tôi vậy server lưu trữ thì phải dùng Windows server thôi chứ không được dùng các loại Windows khác hả.

Có người bảo tôi Windows server với cơ chế họat động chuyên biệt của nó có thể không cần reboot trong nhiều ngày, thậm chí nhiều tháng. Tôi biết và đồng ý chuyện đó. Tuy nhiên tôi có người bạn đang dùng Windows 7 để lưu trữ (xin nhớ chỉ dùng thuần túy lưu trữ à nghen) thế mà hơn 6 tháng không cần reboot vẫn chạy ngọt ngào phà phà. Còn như nếu bạn còn dùng nó để search web, bittorent, mấy thứ linh tinh, thậm chí chơi game thì tình huống sẽ khác.

Windows 32 hay 64 bit không quan trọng hay ảnh hưởng nhiều, nhưng do việc tính toán RAID sẽ cần nhiều bộ nhớ (> 4GB nếu dung lượng lưu trữ nhiều) khi tính toán parity nên tốt nhất bạn nên cài loại 64 bit. Ngoài ra có nhiều bạn thích dùng remote desktop control để truy cập vào máy từ xa (headless), trừ phi bạn sẽ dùng Windows Server, nếu dùng Windows 7 hoặc 8 thì lần cài lần khó ta nên “chơi lun” từ loại Pro trở lên.

Phần mềm bảo vệ dữ liệu

Để bảo vệ dữ liệu, như đã nói ở phần trên, ngày nay phổ biến có 3 cách hoặc là dùng backup, hoặc là dùng RAID và hoặc là … dẹp đi hổng xài nữa nên không cần bảo vệ (cái này mới chế ra…). Nói đùa vậy thôi, ít thì được chứ nhiều dữ liệu quá (như phim HD chẳng hạn) thì dùng phương án backup rõ ràng là không hiệu quả rồi. Xin xem những hạn chế của backup trong bài “RAID bạn biết gì về nó”.

Còn đối với RAID thì sao? Lựa loại RAID nào? Để có được sự lựa chọn chính xác, tôi đã dùng phương pháp loại suy.

Trước tiên là Hardware RAID. Anh này khỏe mạnh, nhanh nhẹn, gọn gàng rồi. Tuy nhiên vật cản lớn nhất là cái giá của nó. Vâng với cái giá chát như vậy khó lòng mà một người dùng gia đình với tới được. Hoặc giả có với tới được cũng … không ngu gì. Loại!

Còn Fake (hay Host) RAID thì sao? Những giới hạn cố hữu của nó là: thứ nhất chết theo với firmware. Firmware của nhà sản xuất cho phép mình thiết lập RAID như thế nào thì phải theo y chang như thế ấy, nếu có gặp bug thì cũng ráng chịu. Khả năng bug được sửa vừa chậm vừa ít. Thứ hai là chết theo board (ở đây là motherboard và card board Sata rời). Giả như cái mainboard hay cái card rời chán sống muốn quy tiên sớm, bạn còn không lo nhanh chân kiếm cái y chang vậy về thế liền. Nhưng nếu lỡ may hàng không có (sau vài năm hết nhập về vì không lời, hoặc nhà máy ngưng lâu rồi không sản xuất nữa), tôi chắc rằng có người đang kiếm cho mình sợi dây đặng treo cổ chết cho rồi! Vâng, loại luôn.

Cuối cùng là software RAID. Nói về software RAID thì một rừng cũng không khác gì thị trường smartphone ngày nay vậy. Vấn đề là lục trong đống hổ lốn đó thằng nào là thích hợp cho yêu cầu của mình mới là quan trọng: HTC One? iPhone 5S, Samsung Galaxy Note 3, hay Sony Xperia Z1…? Nếu như bên smartphones sẽ có sự tranh luận nảy lửa khi bênh vực cho loại phone mình đang xài thì bên software RAID cũng sẽ không khác gì.
Trên thị trường hiện này ngoài những software RAID được viết chuyên sâu đặc biệt cho một phần cứng nào đó ví dụ như Synology, Qnap, Buffalo hay cao cấp hơn dùng cho các doanh nghiệp là EMC, NetApp, DataDomain,..., ta còn có các loại software RAID viết mang tính phổ thông, đa dạng và tính tương thích cao đối với đa phần các loại máy lưu trữ gia đình. Trong đó phải kể đến các bậc cao thủ đã và đang làm mưa làm gió như unRAID, ZFS, FlexRAID, disParity,SnapRAID, Storage Spaces, and Btffs.

Dưới đây là bảng so sánh từng đặc điểm của chúng. Trong trường hợp bạn sẽ lựa một trong chúng (tôi cũng đang xài một trong chúng) thì bạn sẽ quyết định lựa thằng software RAID nào?




(còn tiếp)

[System Info] Tôi đã xây dựng, bảo vệ và quản lý kho dữ liệu HD của mình như thế nào

Lời nói đầu:

Theo thông lệ, cứ mỗi khi năm hết Tết đến, anh em HDVietnam ngoài những tất bật lo toan chuẩn bị mọi thứ trong cái bận rộn cuối năm, họ còn cố ráng dành chút thời gian lên mạng sưu tìm những bộ phim hay, những bản nhạc vui lưu cất vào trong ổ cứng để mang ra thưởng thức trong những ngày nghỉ của mình cùng gia đình và bạn bè. Nhưng đây cũng là lúc họ đối diện với một sự thật là các ổ cứng của mình đang đầy ắp ngắc ngứ thập cẩm các thứ mà họ đã thu thập trong suốt cả năm. Vâng đây cũng chính là lúc ta nên, một lần rồi khỏe, xây dựng lại kho dữ liệu của mình sao cho gọn gàng, nhẹ nhàng, được bảo vệ và nhất là khi cần cái là có.
Dịp cuối năm này cũng là dịp tôi gia nhập đại gia đình HDVietnam được tròn 4 năm. Như là một tấm lòng tri ân, tôi xin được mạn phép chia sẻ những thành quả, kinh nghiệm trong quá trình xây dựng kho hệ thống dữ liệu HD của mình trong suốt gần 8 năm lăn lóc, vật vã với chúng.






Bài sẽ có 3 phần lớn bao gồm phần về việc xây dựng, về bảo vệ và về quản lý dữ liệu.

Cái gì quan trọng trước thì tôi nói trước. Do đó xin có vài điểm lưu ý sau đây:

- Nếu kho dữ liệu của bạn không quá 2 hoặc 3 HDD (hard disk drive) hay không quá 5 TB. Ngoài ra, bạn không có ý định tăng thêm chúng, chủ đề này sẽ không thích hợp cho bạn.
- Xin nói trước, chủ đề này dành riêng cho một hệ thống lưu trữ ổn định. Nếu kho lưu trữ HD của bạn bị thay đổi liên tục, cứ xóa chép xóa chép liên miên mỗi ngày thậm chí mỗi giờ (torrent chẳng hạn), nó cũng sẽ không thích hợp cho bạn.
- Ngày nay các ‘anh hùng bàn phím’ trên các diễn đàn thường dùng thì giờ nhàn rỗi của mình rảo quanh quanh gặp cơ hội là ra sức chê bai và ganh tị mỗi khi họ có dịp. Tôi xin nói trước và nói thẳng, nơi đây sẽ không phải là đất diễn của các bạn đâu. Bởi vì, như tôi đã nói ở đầu, tôi viết bài ở đây không nhằm khoe kiến thức, khoe của, hay dạy đời ai. HDVietnam đã dày công giúp cho chúng ta có một sân chơi tầm cỡ và thoải mái, vậy tại sao chúng ta không tận dụng nó làm nơi học hỏi, trao đổi kiến thức, kinh nghiệm lẫn nhau thay vì phá nhau, kích bác nhau? Tôi có thể nói đúng, nói sai (vì không ai toàn vẹn) và rất vui khi nhận các đóng góp ý kiến của tất cả các bạn. Tôi sẽ post lại các ý kiến hay và bổ ích từ các bạn đồng thời sẽ credit dưới tên của các bạn. Nếu bạn nào vào đọc thấy không thích, bạn có thể qua các topic khác. Nên nhớ đó là quyền của các bạn.
- Vì trình độ và kiến thức của các thành viên trong diễn đàn không đồng đều và cũng vì độ khó của chủ đề, tôi sẽ cố gắng trình bày (với ví dụ) thật đơn giản, ngắn gọn trong mức có thể. Nếu có bạn nào ‘không biết gì về điện’ mà lỡ có bị ‘bơi’ vì không theo kịp thì cứ bình tĩnh đặt câu hỏi (hoặc PM) trong khả năng tôi hy vọng sẽ trả lời thấu đáo cho các bạn. Giả như tôi cũng chịu thua thì tôi sẽ cố hỏi giúp các bạn hoặc các bạn khác giỏi hơn tôi sẽ giúp đỡ các bạn. Dù có giúp chỉ được một người tôi cũng thấy vui.
- Ở mỗi phần sẽ có vài chủ đề riêng biệt, khi gặp các chủ đề lớn phải viết dài, tôi sẽ post ra một topic riêng và lấy link về nhằm tránh làm loãng topic này.
- Cuối cùng, có một vài từ chuyên môn tiếng Anh khi diễn giải qua tiếng Việt nghe rất ư vô duyên. Ngoại trừ bạn nào có cách diễn dịch hay hơn, còn không tôi nghĩ tốt hơn cứ để nguyên vậy. Cụm từ ‘dữ liệu HD’ sẽ được nhắc đi nhắc lại nhiều lần. Ở đây ta nên hiểu đó là những file/ folder lớn (nhạc > 10MB/ file, phim > 10GB/file).


Đặt vấn đề:

Một lần, trên diễn đàn này, tôi có đọc một topic về chủ đề sắp xếp phân loại phim như thế nào khi lưu trữ (sưu tầm phim) trên HDD. Có bạn than thở một cái HDD vừa toi thế là toàn bộ phim trong đó về chầu ông bà không cách gì cứu được. Có một bạn lập luận đơn giản. Nếu 1 HDD chết thì cứ việc ra tiệm bỏ vài chục ngàn chép cái khác, hơi đâu lo. Thiệt là khổ, tôi lại không nghĩ như thế. Bộ sưu tầm của tôi có đến 80% là Bluray đều được lựa chọn cẩn thận và test kỹ càng. Không phải những bộ phim nào tôi cũng có thể chạy ra tiệm một cái là có chép về. Và dĩ nhiên là tôi cũng càng không muốn chúng ra đi không kèn không trống cùng với cái bad hard drive. Tôi biết chắc là trên diễn đàn này ít nhiều cũng có các bạn đồng quan điểm với tôi.
Vậy tại sao chúng ta không thử đi tìm và lựa chọn cho mình một giải pháp tốt nhất để lưu trữ và bảo vệ những bộ phim quý mà lâu nay chúng ta bỏ nhiều công sức và thời gian sưu tầm chúng?

Nhớ hồi nhỏ một lần tôi xách giỏ đi chợ phụ mẹ tôi. Chợt nghe một người bán trái bơ (avocado) nạt một chị khách hàng đang lựa bơ: “Có mua hay không? Sao cứ ngồi bóp hết trái này đến trái kia vậy?” Chị kia giật mình run rẩy nói giọng thểu não: “Bị tui cũng không biết lựa làm sao”. Cũng vậy, chúng ta không thể chọn mình một giải pháp lưu trữ, bảo vệ (backup) tốt nhất (độ tin cậy cao, ít hỏng lỗi, dễ bảo trì,…), phù hợp nhất (rẻ tiền, dễ làm,…) cho bộ sưu tập phim của chúng ta mà không biết gì về chúng.

Phàm khi bắt tay thực hiện việc gì, ta cũng nên đặt mục tiêu ra trước rồi sau đó mới tính các bước thực hiện nó cho hiệu quả.
Vậy bài toán được đặt ra là cùng với ổ chứa HĐĐ (OS), tôi hiện đang có cả thảy 40 ổ HDD với hơn 100TB dùng để chứa phần lớn phim Bluray, phim HD, rồi nhạc, hình ảnh và các thông tin bài vở cá nhân cần lưu trữ tuy không thật quan trọng nhưng cần thiết phải được lưu giữ và bảo vệ cẩn thận. Những ổ HDD này có các dung lượng khác nhau, thấp nhất từ 2TB, rồi 3TB đến 4TB. Cụ thể là 15 ổ 2TB, 9 ổ 3TB, 15 ổ 4TB và 1 ổ SSD 90GB dùng cho OS. Xin lưu ý, các con số dữ liệu tôi đưa ra được lấy từ hệ thống tôi đang sử dụng và chỉ có tính minh họa là chính, ngoài ra không có ý gì hết.





Các yêu cầu của tôi (và tôi biết nhiều anh em cũng có cùng quan điểm) là:

- Chạy trên một hệ điều hành dễ cài đặt, không rắc rối lằng nhằng phải học lại từ đầu câu cú command lines. Khi cần thì truy cập tìm thông tin qua mạng dễ dàng, ai cũng có thể vận hành sử dụng và nhất là có số đông người hỗ trợ mình kịp thời (nếu bị bí).

- Không hao tốn tài nguyên nhiều (ram, cpu, …) và vì có thể chạy 24/7 nên càng đỡ hao điện, ồn, phát nhiệt càng nhiều càng tốt. Tôi lấy ví dụ, đứa con gái tôi nó muốn xem phim hay nghe nhạc nằm trên ổ thứ 30. Vậy thì trong lúc đang xem/ nghe thì ngoài ổ OS, chỉ có mỗi một ổ số 30 là hoạt động thôi, còn những ổ HDD còn lại vẫn duy trì trong trạng thái ‘ngủ’. Có như vậy thi hệ thống của tôi nó không ồn. Và vì chỉ có mình ổ HDD số 30 làm việc nên không sinh nhiệt cao trong box. Chứ cả 40 ổ cùng chạy một lúc từ đầu đến cuối phim thì cuối tháng tiền điện trả gì thấu?

- Dữ liệu của tôi phải được bảo vệ cẩn thận (lưu ý ở đây tôi tránh sử dụng từ backup và sẽ giải thích sau). Vì các ổ cứng có dung lượng khác nhau, không cần biết dùng phương pháp nào (raid rác gì đó) mà tổng dung lượng bị trừ đi sau khi build phải là ít nhất. Ví dụ nếu tôi sử dụng Raid 5 hoặc dạng tương tự (tức hy sinh một ổ) thì mấy ổ HDD 3TB hay 4TB không bị cắt bớt về còn 2TB. Chứ nếu bị cào bằng tức ổ HDD nào cũng bị coi là 2TB thì oan mạng cho mấy ổ 3TB và 4TB quá!

- Nếu dàn ổ HDD của tôi đột nhiên cùng lúc bị hư 1 ổ, 2 ổ, hoặc thậm chí 5 hoặc 6 ổ thì sau khi thay các ổ mới vào tôi vẫn phục hồi lại dữ liệu bị mất trên những ổ hư đó. Còn 1 cái quan trọng hơn nữa là giả sử vì một nguyên nhân nào đó (sốc điện chẳng hạn), cả chục ổ HDD trên cùng 1 rail 12V rủ nhau tèo một lúc thì khi đó thằng nào chết ráng chịu, còn những ổ không hư vẫn đọc được dữ liệu bình thường như không có chiện gì xảy ra.

- Sự tiện lợi. Buồn tình tôi có thể nhổ bất cứ HDD nào trong hệ thống đem đi cắm vào bất cứ máy nào trong gia đình hoặc tình thương mến thương cho thằng bạn mượn chép hoặc coi phim tạm vài ba ngày ở bên nhà nó cũng đều được không cần format lại chi hết và dĩ nhiên hệ thống của tôi vẫn chạy và cho đọc các ổ khác bình thường. Cũng vậy, tứ hải “nhai” huynh đệ, thằng bạn lại quả cho mượn cái HDD vừa chép các loại phim mới, tôi mang về cắm vào hệ thống vẫn nhận và đọc bình thường share cho cả nhà mà cũng không đòi hỏi phải format lại (chứ format cái hard drive mất hết phim của nó thì có mà nó chém chết!). Nếu muốn cái ổ của thằng bạn cũng được bảo vệ thì khều hệ thống một cái “Ê tao muốn cái ổ này cũng được bảo kê nghen, chứ nếu nó tèo mất hết phim thì thằng bạn nó giết tao”. Bụp …xong! Máy bảo vệ cái ổ mới nhẹ nhàng. Yên tâm ngủ khỏe.

- Lâu ngày dài tháng, đua đòi với anh em chúng bạn tập xem Bluray, 40 cái ổ của tôi bỗng chốc đã đầy, sọc đỏ nổi lên tứ bề trong My Computer. Tậu thêm cái ổ mới, chỗ bán HDD khuyến mãi chép sẵn phim rồi, giờ tôi chỉ việc vác về mà cắm vào không quan tâm phải format hay phải build lại cái raid mới từ đầu vừa đỡ hại máy hại ổ, vừa đỡ tốn điện mà biết đâu lỡ không thành thì cả đám dữ liệu sưu tầm bao năm nay đều đội nón ra đi không hẹn ngày tái ngộ. Hoặc cái box/ motherborad của tôi hết còn chỗ để cắm thêm HDD mới. Tôi buộc phải nâng cấp thay ổ 2TB bằng ổ 3 hoặc 4TB, sau vài thao tác copy/ paste, tôi có thể swap chúng mà vẫn được hệ thống chấp nhận nhẹ nhàng như thường.

- Nhanh một chút. Tốc độ read/write cũng phải nhanh nhanh một chút. Nhất là cái vụ hai ba cái hard drive bị hư phải khôi phục lại. Năm bảy tiếng thì không thành vấn đề gì, chứ mà kéo dài ngày này qua ngày kia là tôi không ưng bụng đâu. Và dĩ nhiên trong lúc chờ đợi phục hồi, cả nhà tôi vẫn xem phim nghe nhạc bình thường từ hệ thống.

- Bạn có bao giờ để ý cái biểu tượng logo màu đỏ của HDVietnam chưa? Bạn có thấy gì quen quen không? Vâng, những cái ô vuông vuông đó. Tôi dám chắc ít là một lần trong đời khi coi phim từ các nguồn trôi nổi trên mạng hoặc chép từ tiệm (thì cũng rứa), bạn đã thấy những cái ô vuông vuông đó xuất hiện nhăng nhít trên màn hình rồi thậm chí kèm những âm thanh rít lên chói tai rất ư là khó chịu. Bạn có biết là do cái gì ra không? Người thì nói do hard drive bị bad sector, người thì nói do phim bị hư, vv… Nhưng có một nguyên nhân nữa có thể bạn chưa biết nhưng vô cùng nguy hiểm mà firmware của hard drive và ngay cả OS ngày nay cũng như các phần mềm chuyên dụng để quét và sửa lỗi ổ cứng cũng không thể nhận ra. Đó là bit rot. (Xin xem thêm bài viết về “Bit rot – Kẻ sát thủ vô hình của dữ liệu HD”). Vâng, tôi cũng muốn kho lưu trữ dữ liệu HD của tôi cũng được bảo vệ từ bit rot.

- What? 40 ổ HDD hả nhiều quá, làm sao biết bộ phim nào hoặc bản nhạc nào nằm ở ổ nào mà kiếm để nghe/ xem đây chời? Chẳng lẽ ngồi in vài chục tờ sớ Táo quân của từng ổ HDD rồi ngổi lò mò dò theo nó. Xem ra không pro chút nào, phải không các bạn? Vâng, tôi muốn gôm tòn bộ mấy chục ổ đĩa này về một mối. Ví dụ là chỉ cần vào 1 ổ D drive thôi thì phim phóng nhạc nhẽo gì cũng đều được thấy trong đó theo các phân loại từng folder như Music, Bluray, HD movies, …

- Nói tới quản lý thì phải quản lý cho nó tới lun. Tôi cũng muốn các ổ HDD từ 1 tới 10 chứa chỉ toàn phim Bluray thui, còn từ 11 đến 14 làm các phim tài liệu, vv… cùng với danh sách tên phim đầy đủ của từng ổ một. Để lỡ khi ổ nào bị tèo mà không cứu được thì tôi cũng biết mình đã bị mất những phim gì. Hoặc vì biết đâu một ngày đẹp trời nào đó, vợ thằng bạn liếc mắt đưa ghèn hỏi mượn xem Thúy Nga, Vân Sơn mà đưa ổ cứng có lẫn lộn phim xxx trong đó thì chắc bà xã lôi tui ra cạo đầu quá.

- Cuối cùng, chúng ta đang sống trong thời đại smart phone. Đi đâu cũng gặp hoặc nghe bàn tán về các loại smart phone. Nhà nhà mua smart phone, người người sắm smart phone. Tôi cũng muốn tận dụng dùng cái SS note của mình để kiểm tra tình trạng của máy. Nếu xảy ra một trong những cái HDD của tôi đang có vấn đề, một cái email hoặc text sẽ được bắn tới phone tay của tôi ngay lập tức và chỉ rõ thằng cu Tèo nào, ở đâu, đang nhức đầu sổ mũi để tôi kịp thời can thiệp trước khi quá trễ.


Phần 1: Xây dựng hệ thống


Trước khi đi vào phần chính, tôi xin có vài nhời nói rõ hơn lý do tại sao tôi lại cặm cụi cất công xây dựng kho lưu trữ dữ liệu HD của mình, để không tôi cứ lại phải nghe cái điệp khúc muôn thuở “Xem xong thì xóa đi ra tiệm (cửa hàng) bỏ tí tiền chép về cái khác”.

Số là tôi say mê xem phim ảnh từ nhỏ, nhưng bắt đầu sưu tầm lưu cất phim bắt đầu từ năm 2005 cái thời tôi tập tọe down bằng torrent. Khi phong trào phim HD chớm nở, tôi chuyển qua lưu trữ phim từ dạng .avi sang .mkv với sự trợ giúp đắc lực của MegaUpload (lúc này cũng bắt đầu nổi như cồn).
Cách đây 3 năm, tôi chuyển hẳn qua chơi Bluray. Thỉnh thoảng cũng có xem 1 vài phim HD (thuộc loại quá hay mà Bluray không có hoặc chưa ra) mà thôi. Dĩ nhiên là có hao tốn thêm, nhưng dạng Bluray nó có cái hay riêng với điểm nhấn của nó chủ yếu là phần âm thanh mà tôi không thể nói dài dòng tại đây. Nay thì bộ sưu tập phim của tôi đã vượt quá 60TB trong đó khoảng gần 80% là thể loại Bluray nguyên gốc, phim HD (1080p/720p với DTS/ Dolby Digital) chiếm 15% còn lại là .avi và các dạng DVD iso linh tinh. Có người đặt vấn đề tại sao tôi lại phải tốn công tốn của cất lại những bộ phim đã coi rồi trong khi xác xuất coi lại chưa tới 5%? Biết thế nhưng cái tánh tôi nó vậy. Nhiều lúc đang suy nghĩ một chuyện chợt nhớ đến bộ phim nọ thế là nhào ra xem lại cái đoan phim đó. Thiệt nó đã gì đâu. Nhiều lúc tán dóc ngồi nghe người này người kia hoặc trên HDVietnam nhắc lại cái hay của một bộ phim cũ, hoặc chưa có dịp coi thế là về nhà bật máy lôi phim ấy ra xem. Vừa xem vừa nghiễn ngẫm nhữnng lời bình của họ, thiệt là thấm làm sao. Nói thẳng, tôi không là một cinephile gì ráo, đơn giản thú xem phim của tôi nó là thế.

Vậy thì cái kho phim Bluray của tôi thế nào? Để có cái tên được niêm yết trong cái list của bộ sưu tầm phim của tôi, bộ phim ấy phải đáp ứng một số tiêu chí (dĩ nhiên cũng có du di nhưng không đáng kể < 2%)

- Phim tôi có không phải thuộc loại thượng vàng hạ cám, cái gì cũng chép về bừa bãi nhằm để tăng số lượng, dung lượng, nhằm để khoe khoang thành tích. Tất cả chúng phải đạt tối thiểu điểm 5 trở lên (tại thời điểm tôi xét vì có vài phim bị rớt điểm sau một vài tháng/ năm) theo đánh giá của trang IMDB. Vì phim quá tệ thì cất giữ làm giề?

- Phim Bluray đó phải được sản xuất từ năm 2000 cho tới nay. Về sau để làm phong phú cho kho phim, tôi có nới rộng thêm 10 năm nữa, tức chỉ có những phim từ 1990 về sau này. Trừ những phim đã quá nổi tiếng trong nền điện ảnh thế giới như là Ben-Hur, Seven Samurai, Gone with The Wind, The Bridge on the River Kwai, loạt phim của tài tử kiêm đạo diễn Charles Chaplin, … Vậy tại sao phải là sau năm 2000? Xin thưa, phim cũ mà được “remaster” lên thành đời phim Bluray thì coi chán phèo à. Ngay cả chúng được digital audio mastering thành DTS-HD MA hay Dolby TrueHD nghe nó cứ trơ và thô làm sao không có lực để tạo cảm giác sống động (live). Cũng vậy, dù được “remaster” thành 1080p hoặc 1080i thì hình xem thấy nhiễu hột đầy ra hết ở một số phim. Thôi chắc ăn muốn xem phim cũ cứ về HD mà coi cho lành.

- Phim phải thuộc các Genres như Action, Crime, Adventure, History, Horror, Thriller, Mystery, Sci-Fi, War và Western. Còn nếu thuộc dòng Comedy, Drama, Family, Fantasy, Romance hay Sport thì phải được IMDB đánh giá từ 7.0 trở lên (nhưng tôi sưu tầm loại này cũng không nhiều khoảng trên dưới 5%).

- Phim buộc phải có phụ đề tiếng Anh (để vừa hiểu lời thoại phim cách trọn vẹn vừa tranh thủ học thêm tiếng Anh), nếu kẹt quá không kiếm được phụ đề thì dùng tạm phụ đề tiếng Việt. Chứ tôi thì không thích làm việc của thầy bói, vì nghe không kịp, nên vừa coi vừa đoán xem nhân vật trong phim đang nói gì.

- Phim phải được rip trực tiếp từ dĩa bluray (dĩ nhiên còn nguyên quảng cáo, warning, …) Sẽ cũng có người nói tôi vụng tính vì chúng chiếm quá nhiều dung lượng hard drive. Nhưng tính tôi nó vậy, thích sự trinh nguyên chưa bị qua tay người khác. Nói giỡn vậy thôi, tại tôi gặp rắc rối quá nhiều với các phim đã được remux thành .mkv. Lúc thì hình không lên, âm thanh không đúng (mất DTS-HD MA / Dolby TrueHD), không hiện phụ đề, … Chắc tại mỗi người remux một kiểu nên nó thế. Mặc dù vậy khoảng 20% phim sưu tầm của tôi đang ở dạng remux vì tôi không thể tìm ra bản rip gốc của nó.

- Cuối cùng nhưng quan trọng nhất, chiếm thời gian nhiều nhất, là tất cả các phim của tôi đều được test cẩn thận từ đầu, giữa và cuối phim qua HTPC và HD player để bảo đảm không có sai sót lỗi vặt một khi tôi muốn bật chúng lên xem.


Lựa chọn và triển khai phần cứng hệ thống.

Tôi thiết nghĩ cũng nên nói trước và nói cho minh bạch nhằm tránh những đôi co rắc rối khi chúng ta tranh luận sau này. Dưới đây chỉ là ý kiến cá nhân dựa trên kinh nghiệm và kiến thức thu thập qua sách vở, bạn bè và trên các diễn đàn. Và cũng vì là ý kiến cá nhân nên sẽ có đúng, có sai. Vì lẽ đó, các bạn cũng nên coi đây chỉ có giá trị tham khảo, chứ không phải là chuẩn mực buộc phải làm theo. Bởi vì chính bản thân tôi cũng không thích những ý kiến dựa trên kinh nghiệm cá nhân không chính xác và mang tính đơn lẻ được post lên diễn đàn rồi gần như ép người khác theo mình.

Còn nữa, tôi xưa nay vốn bình dân nên luôn quan niệm đơn giản càng nhiều càng tốt. Điều này cũng được áp dung dụng triệt để khi tôi xây dựng cho mình một cái server lưu trữ dữ liệu HD. Nói cách khác, các loại hardware tôi sử dụng cũng chả khác gì một cái máy PC bình thường. Kinh nghiệm máu xương cho thấy, khi sử dụng gói gọn trong gia đình, một home media server không cần thiết phải sử dụng các linh kiện (motherboards, CPUs hay hard drives ) chuyên dụng đắt tiền thường thấy trong các server dành cho doanh nghiệp. Thậm chí nếu được, tôi cũng khuyên bạn tận dụng luôn các linh kiện hoặc máy cũ để xây dựng hệ thống lưu trữ phim, nhạc.

Cuối cùng khi nói về phần cứng hệ thống (hardware), vì không là điểm nhấn của bài này, tôi sẽ cố nói ngắn gọn những điểm chính mà một người thích lưu trữ HD cần quan tâm. Còn những thứ căn bản bạn có thể tham khảo tại các chuyên mục “hệ thống lưu trữ khủng” hoặc gần đây có bài “music server”. Chúng đã được trình bày và thảo luận khá đầy đủ ở đấy.





OK, theo cái rule của tôi, cái gì quan trọng trước nói trước.

1/ Case

Tôi đã chọn case LIAN LI PC-D8000 Black Aluminum ATX Full Tower







Không giống như trường hợp lúc ráp một máy tính thông thường, ta thường nghĩ đến motherboard, CPU, RAM,..trước. Nhưng ở đây cá nhân tôi thì lại đi chọn case trước. Thật vậy, khi chọn lựa case cho một hệ thống lưu trữ HD, nó sẽ cho ta một tầm nhìn bao quát hơn về dự án (project) mà mình sắp thực hiện. Qua cái case, chúng ta sẽ biết liệu motherboard sẽ là loại (factor) gì. Và quan trọng là bạn biết sẽ có bao nhiêu ổ HDD sẽ được lắp vào, và trong tương lai hệ thống của chúng ta sẽ được mở rộng tối đa là bao nhiêu ổ cứng HDD. Kích thước của case cũng sẽ giúp ta hình dung nó sẽ nằm ở vị trí nào trong gia đình mình là thích hợp.

Case phải đáp ứng một số tiêu chuẩn sau:

- Một cái case đẹp? Không phải. Vì sẽ đóng vai trò của một máy lưu trữ dữ liệu, nên yếu tố hàng đầu và quan trọng nhất là case phải được thiết kế sao cho dòng không khí làm mát trong nó là tối ưu nhất. Ngạc nhiên? Tôi khuyên các bạn luôn nhớ một điều trong đầu là không phải cái case nào cũng giống cái case nào cho dù là đắt hay rẻ tiền. Vì tôi không khuyến khích các bạn sử dụng video card rời trong hệ thống lưu trữ, do đó các nguồn sinh nhiệt sẽ là: CPU, chipset, ram (không đáng kể), và nhất là các HDD. Bằng cách nào không cần biết, phải cho dòng không khí liên tục luân đổi qua những bộ phận này. Đó là nguyên tắc vàng! Có vào thì phải có ra. Tức khi lựa case phải bảo đảm dòng không khí mát sẽ đi vào một đầu (thường ở phía trước) và ra ở đầu khác để luôn giữ nhiệt độ trong case bằng hoặc cao hơn nhiệt độ môi trường một chút. Bạn cũng có thể sử dụng PSU như là một nguồn thông khí nóng ra ngoài.

- Trừ phi bạn đang build cái NAS nho nhỏ để chung với đầu HD player hay HTPC trong phòng khách, còn không case phải to (nếu có thể được). Thói thường con người ta ai cũng thích to (đặc biệt trong giới chị em – cái của mình cũng thích to đã đành họ lại còn muốn “cái” của người khác to mới ghê chứ). Nói đùa tí cho bạn đỡ nhức đầu khi đọc. Vâng, case to nhằm dễ dàng tổ chức dây nhợi giúp lưu lượng không khí thông thoáng được nhanh hơn, nhiều hơn. Bạn có muốn ở nhà cao cửa rộng không? Nếu bạn trả lời có thì mấy cái HDD chúng cũng có sở thích y chang bạn. Tôi có thể đồng ý để cái server của mình ở một góc xó xỉnh nào đó (vì tình hình không gian chật hẹp chung của gia đình) nhưng tôi sẽ cố có một cái case to trong mức có thể vì không gian bên trong box có ảnh hưởng trực tiếp đến sự làm việc và độ bền của tất cả bộ phận máy, đặc biệt là HDD.

- Case đồng thời cần có độ tùy biến cao. Tại sao phải có độ tùy biến cao? Như đã nói trên, để tránh cho HDD bị hư vì quá nóng, nên bố trí quạt thổi gió đi qua từng ổ một. Gió thổi hiu hiu cũng được. Kinh nghiệm cho thấy, rất hiếm khi cái HDD nào có gắn quạt mà tự nhiên hư (ngoại trừ có thêm yếu tố điện/ cơ trong đây), riêng tôi chưa bị cái nào. Có 2 điều cản trở ở đây. Thứ nhất, không phải tất cả các case đều thiết kế cho phép gắn quạt đến từng ổ cứng. Thứ hai, cứ ổ cứng là phải gắn quạt thì ồn lắm. Để khắc phụ các điều trên, yếu tố tùy biến cộng với hoa tay và đặc biệt là óc sáng tạo sẽ giúp ta có thể sửa cái case lại một chút để gắn thêm quạt nhằm phù hợp tiêu chuẩn mình đặt ra đồng thời cũng không làm mất đi vẻ thẩm mỹ ban đầu của case. Xin xem ví dụ minh họa trực tiếp từ cái home server của tôi trong cách khắc phục 2 yếu điểm trên. Ngoài ra do sự truyền nhiệt không đủ, không nên nghĩ lắp HDD vào case rồi dùng case (cho dù nó là nhôm đi nữa) để làm tản nhiệt cho HDD.
Nếu bạn tận dụng case cũ, cứ mạnh dạn tháo bung nó ra. Đục, khoan, cắt, uốn sao cho đáp ứng các yêu cầu của mình.

- Case phải kín nội bất xuất ngoại bất nhập. Bất xuất nhằm hạn chế tránh đi tránh tiếng ồn từ máy ra. Bất nhập nhằm tránh bụi bặm hoặc côn trùng chuột gián xâm nhập vào máy cắn phá ỉa đái (xin lỗi nhưng có thật). Cái này thì tôi công nhận case càng đắt tiền thì càng tốt.

- Case được thiết kế vững chắc, không rung sóc và bản thân case không gây ồn khi máy đang vận hành. Thường case đắt tiền sẽ tốt hơn.

Phần về case đã khá dài, tuy nhiên trước qua phần khác tôi xin gợi mở thêm 2 vấn đề liên quan về case để các bạn chúng ta cùng thảo luận đưa ý kiến của riêng mình xem như thế nào:
Thứ nhất, đối với hệ thống lưu trữ HD gia đình, có nên mua loại case có thể hot-swapping hard drive (tức case cho phép chỉ cần mở chốt gài là có thể lấy cả hard drive ra ngoài trong khi máy vẫn chạy) hay không? Có an toàn không? Có cần thiết không?
Thứ hai, khi tìm mua hoặc tự thiết kế case, bạn có quan tâm khi lắp hard drive vào case, nên đặt HDD nằm ngang (bình thường), nằm ngửa, nằm dọc, hay … không quan tâm? Tại sao?
Tóm lại, dù có nói dài dòng, mục đích chọn case phần nhiều cũng chỉ làm nhằm bảo vệ và làm tăng tuổi thọ của HDD cũng như các bộ phận trọng yếu trong máy mà thôi.



Em nó lúc mới mang về

Tôi mua 2 mini case Cooler Master 4in3 để tận dụng khoảng không gian của 5 optical drives và 1 công tắc để chứa thêm 8 HDD ở phía trước. Còn hộp công tắc thì bố trí trên nóc case. Nhìn cũng không đến nỗi tệ lắm.





Gắn mini case vào case lớn



Hoàn tất nhìn từ phía trong case


Còn dàn ổ cứng phía sau là tôi tận dụng khung sườn chứa HDD của một full tower case cũ chế lại thôi chứ không có gì đặc sắc.



Lắp mobo vào khay rời ở bên ngoài



Đấu dây quạt còn 7V giúp giảm tiêu hao điện, bớt ồn nhưng vẫn giải nhiệt cho HDD tốt



2/ Ổ cứng – Hard Disk drives

Một trong những xu hướng lớn mà Cnet dự báo sẽ gây nên cơn bão tại CES 2014 sắp tới đây cho các loại máy tính là màn hình độ phân giải cao.

Nếu như trước đây bạn chỉ thấy độ phân giải của màn hình chỉ đến Full-HD 1920 x 1080 ở các máy cao cấp thì những năm tới đây độ phân giải Full-HD cũng sẽ được phổ cập hơn đến các phân khúc máy tính tầm trung cũng như tablet và hybrid. Nếu bạn đã quen với sự mịn màng bởi độ phân giải cao trên smartphone, tablet thì cũng không có gì quá ngạc nhiên khi bạn sẽ đòi hỏi một trải nghiệm tương tự trên các thiết bị mà bạn dùng để làm việc, giải trí hằng ngày. Điều này cũng đòi hỏi nội dung (content) của bạn sẽ ngày càng chiếm nhiều dung lượng hơn. Chạy qua chạy lại, né qua né lại trước sau gì bạn cũng phải đối mặt với vấn đề phải mua sắm thêm ổ cứng. Do đó tôi đặt nó ở vị trí quan trọng thứ hai.

Ngày nay, theo ý kiến cá nhân, các ổ đĩa cứng cho dù là thương hiệu gì về cơ bản chúng được sản xuất với công nghệ gần như tương đồng nhau. Do đó việc mua sắm theo tôi nghĩ chủ yếu phụ thuộc vào những thương hiệu mà bạn xưa nay thích cũng như những cái giá hời mà bạn có thể tìm thấy khiến bạn phải móc hầu bao ra mua. Như đã nói nhiều lần trên diễn đàn này, cá nhân tôi không quan tâm lắm về thương hiệu miễn sao chúng rẻ, được bảo hành tốt và thời gian BH lâu một chút là được. Cái mánh của tôi là chỉ mua ổ đĩa khi tôi thực sự sẽ bắt đầu sử dụng nó để giữ thời gian bảo hành của ổ đĩa dài hơn đồng thời biết đâu sau này vớ được cái nào giá giảm thêm một chút thì sao?

Cũng tương tợ như bên music server, mặc dù các loại phim bluray sẽ đòi hỏi bitrate cao hơn, nhưng qua vài năm sử dụng tôi cho rằng loại ổ cứng 5400/ 5900 rpm vẫn dư sức đáp ứng và là thích hợp hơn cả cho hệ thống lưu trữ HD ổn định. Tính năng “green” của các loại ổ 5400 rpm là cho tốc độ thấp nên giảm thiểu tiếng ồn, ít hao điện nên cũng ít tỏa nhiệt. Điều này là đặc biệt quan trọng trên các hệ thống lưu trữ gia đình. Điểm này thì ai cũng biết nên tôi mạn phép không nói sâu thêm. Chỉ có một điều cần lưu ý ở đây là nếu trong hệ thống bạn sử dung hardware Raid thì bạn phải sử dụng ổ đĩa 7200 rpm vì nhiều loại ổ đĩa 5400 rpm không tương thích với hardware Raid. Chỉ là nhắc vậy thôi chứ tôi chắc là ít người dùng gia đình nào dám sử dụng hardware Raid.

Có người hỏi tôi là khi mua mobo có cổng Sata 3 (6Gbit/s) thì phải mua ổ HDD cũng phải loại Sata 3 (6Gbit/s) (thậm chí cả dây Sata 3 luôn) để truyền tải dữ liệu nhanh so với loại HDD Sata 2 (3Gbit/s). Điều đó đúng, nhưng chỉ là trên lý thuyết mà thôi. Cái bottleneck nó nằm ở cái khả năng I/O throughput của chính cái ổ HDD đó chứ không phải là loại giao tiếp gì. Mà cái I/O thoughput lại lệ thuộc vào tốc độ quay cũng như mật độ của phíên dĩa (phần cơ). Ngày nay chỉ có một mình anh chàng SSD là có tốc độ read/write đủ nhanh để tận dụng được tốc độ của Sata 3 mà thôi. Vì vậy, ta sẽ không quan trọng lắm với HDD là Sata 2 hay 3. Còn nếu phải đi tìm để lựa chọn HDD, ngoài tốc độ quay nhanh một chút (nhưng đừng quá nhanh), bạn nên tìm mua loại ổ cứng có số phiến dĩa/ drive càng ít càng tốt (dĩ nhiên mật độ ghi sẽ cao để bảo đảm dung lượng) nhưng bù lại thời gian truy xuất dữ liệu nhanh hơn. Và vì sẽ có ít số đầu đọc hơn nên tỉ lệ hỏng hóc của ổ sẽ giảm đi đáng kể.

Cũng vậy, nhiều ổ đĩa cứng ngày nay cung cấp một bộ nhớ cache lớn hơn hơn bao giờ hết. Phổ biến hiện nay bộ nhớ đệm là từ 32MB - 64MB. Vậy loại nào thì tốt? Dĩ nhiên càng nhiều càng tốt nhưng không thật sự quan trọng. Vì bạn cũng biết bộ nhớ "đệm" này là một bộ nhớ cache cho phép đọc những thông tin gần đây. Nếu như tập tin nào đó cứ được đọc liên tục thì ổ đĩa cứng chỉ đơn giản là gửi dữ liệu từ bộ đệm hơn là nó cứ đi tìm và đọc từ các phiến đĩa một lần nữa. Mà khi coi phim hay nghe nhạc, bạn đâu cứ 1 bộ phim hay bản nhạc cặm cụi ngồi xem/ nghe hoài. Hơn nữa dung lượng của một bộ phim/ nhạc lại qua lớn nên xem ra, cũng giống như trường hợp Sata II & III, lượng cache không đóng vai trò quan trọng lắm.

Tuyệt đối không mua loại hard drive refurbished (các bạn ở trong nước sẽ ít gặp hơn, nhưng biết đâu là hàng xách tay bị “luộc” lại). Đây là loại hàng mà nhà sản xuất đã ‘mông má’ lại sau khi bị trả lại và bán với giá rẻ với thời gian bảo hành ngắn (thường vài tháng). Chúng ta tuyệt đối không biết được khi nào thì em nó lên đường. Thôi mắc một chút cứ mua hàng mới cho lành, đừng chơi ‘trò’ với các dữ liệu quý giá của mình. Kẹt lắm bạn cũng có thể sử dụng lại (hoặc mua lại) các ổ HDD cũ nhưng còn chạy tốt vẩn tốt hơn. Xin đón xem bài viết của tôi về tuổi thọ thực sự của một HDD.




Cuối cùng và cũng là đề tài gần đây được hỏi và bàn tán nhiều đó là sự xuất hiện của ổ đĩa "Red" do WD sản xuất và ổ “NAS” của Seagate dùng trong môi trường NAS. Trong thử nghiệm mà tôi đã thực hiện cũng như tham khảo thêm với một vài thông tin trên các diễn đàn nước ngoài, tất cả đều cho một nhận xét khá giống nhau. Phân tích ra thì khá dài dòng. Ví dụ cho ổ của WD thì nói cho ngắn gọn là thằng da “đỏ” cũng y chang thằng da “xanh” khi được kiểm tra trên thực tế trong hệ thống lưu trữ gia đình. Từ mức tiêu thụ điện đến tốc độ thực hiện các tác vụ. Từ nhiệt độ tỏa ra (thậm chí Red nóng hơn vài độ) cho đến tiếng ồn hầu như là same same nhau. Thật ra thì anh da đỏ kia cũng được trang bị thêm một vài chức năng trong đó nổi bật là TLER hay Time-Limited Error Recovery, nhưng với người dùng gia đình xem ra nó không có tác dụng gì nhiều. Quan điểm của tôi là chỉ sẽ mua thằng Red hoặc Nas nếu chúng không mắc hơn các loại thông thường quá $10 (200K). Thật ra cái giá đó là tôi mua thêm 1 năm BH mà thôi.

Nếu có thể được các bạn nên gắn đệm cao su cho các ổ cứng nhằm giảm sự chấn động rung từ case máy hoặc từ chính HDD ra.








3/ CPU

Khác với các loại máy tính bàn khác, trong một hệ thống lưu trữ dữ liệu HD, thật ra CPU không đóng vai trò quan trọng lắm. Đó là lý do tại sao, nếu bạn để ý kỹ một chút sẽ thấy, các dòng NAS bán sẵn của Synology, Buffalo, Qnap,... đều trang bị mấy con CPU yếu xìu. Trừ phi bạn tận dụng máy cũ để build lại home server, mục đích tôi đưa CPU lên trước motherboard là để khi bạn dứt khoát chọn loại CPU nào rồi thì sau đó bạn tính toán motherboard dễ dàng hơn.

Quan niệm của tôi là mèo trắng hay mèo đen không quan trọng, miễn sao bắt chuột được là được. Vì ngày nay các loại CPU (dùng cho máy tính bàn hay servers) đều rất bền và ổn định, do đó tôi không quan trọng việc dùng chip CPU là Intel hay AMD (hai nhãn hiệu chính hiện nay). Tôi đã sử dụng CPU AMD cho home server của mình trên 5 năm rất tốt không phàn nàn gì lớn. Cách đây gần năm tôi chuyển qua hệ thống của Intel xài thử cũng thấy OK bình thường. Còn nếu có bạn hỏi nếu hiện nay buộc phải chọn cái nào thì tôi xin nói thẳng tôi chọn Intel bởi 2 lẽ: ít hao điện nên cũng ít tỏa nhiệt hơn và quạt theo CPU của Intel đỡ ồn hơn (trừ phi bạn sử dụng quạt rời khác). Vì vậy trong bài này tôi có khuynh hướng nói nghiêng về hệ thống của Intel nhiều hơn. Mặc dù vậy xin đừng quên lợi thế của AMD là giá thành rẻ. Quyết định nằm trong tay bạn thôi.

Thế thì lựa chọn CPU nào cho phù hợp? Theo tôi trừ khi bạn còn dùng cái máy lưu trữ này làm những công việc khác nữa như chơi game, đồ họa, rip phim, zip/ unzip big files, ...CPU mạnh nhất cũng chỉ nên trang bị cho loại máy thuần túy chứa dữ liệu là Intel i3 basic mà thôi. Các bạn dùng AMD thì so sánh loại tương đương. Thế còn loại CPU bèo nhất thì mua loại nào? Tôi luôn đi theo khẩu hiệu “3 thấp”: giá thấp, mức hao hiện thấp, tỏa nhiệt thấp.

Celeron và Pentium có lẽ là sự lựa chọn thích hợp nhất. Tôi chưa xài qua Atom, nhưng tôi cũng không thích thử nó vì Atom sản xuất chủ yếu dùng cho các loại máy nhỏ/ di động. Để cho dễ nhớ, khi mua CPU (hoặc chuyển đổi mục đích sử dụng từ máy cũ) cho hệ thống lưu trữ, phải make sure là nó transcoding tốt mà không bị vấp trong vai trò là một Plex server khi steaming phim nhạc đến các máy trong gia đình qua mạng nội bộ là đạt yêu cầu. Các bạn có thể kiếm thông tin này thêm trên mạng nếu bạn không rành lắm về Plex. Thôi để cho dễ hình dung, tôi sẽ đưa lên đây một số model của CPU Intel đã được kiểm chứng chạy tốt trên thực tế để các bạn dễ tham khảo.

Dòng Sandy Bridge thì có:
Intel Celeron G530 Sandy Bridge 2.4GHz
Intel Pentium G620 Sandy Bridge 2.6GHz
Intel Pentium G860 Sandy Bridge 3.0 GHz

Mới hơn chút là Ivy Bridge:
Ivy Bridge Celeron G1610 2.6 GHz
Ivy Bridge Celeron G1620 2.7 GHz
Ivy Bridge i3-3220 3.3 GHz Dual Core

Riêng với Haswell mặc dù tiếp tục sử dụng cùng cấu trúc 22nm như Ivy Bridge, nhưng nó sử dụng năng lượng hiệu quả hơn giúp tiết kiệm điện và ít tỏa nhiệt rất thích hợp cho hệ thống lưu trữ HD nên ta sẽ không phải nói thêm ở đây.

Mục CPU đã quá dài rồi, nhưng còn một vấn đề nữa nếu không nói ra được thì ngứa miệng quá. Các loại CPU Intel có thêm một dòng song song nữa và nếu bạn để ý sẽ thấy tên của nó được gắn thêm chữ “T” ở cuối. Phiên bản "T", cũng giống như “green" trên thị trường ổ cứng của WD vậy, được PR là rất tiết kiệm điện tuy nó có đắt tiền hơn. Dân nào build HTPC và media server sẽ rất thích đây. Tuy nhiên trên thực tế kiểm nghiệm, điều đó không phải là hoàn toàn đúng. Thông tin được phản hồi trên một vài diễn đàn cho rằng phiên bản “T” không tiêu thụ ít điện năng hơn cho các tác vụ đơn giản. Còn các tác vụ cần load nhiều thì tiết kiệm điện hơn nhưng đổi lại nó chạychậm hơn so với phiên bản thường. Ngoài ra thời gian nghỉ (idle) của chúng thì tiêu thụ điện là bằng nhau.
Lý do duy nhất lý do tại sao một người nào đó nên mua phiên bản T là họ muốn sở hữu cái quạt bé bé xinh xinh đi theo CPU để họ có thể lắp vừa vào những cái case cũng bé bé xinh xinh của họ mà nếu phải mua ở ngoài sẽ có giá không rẻ chút nào.

CPU tôi đang sử dụng là Intel Core i3-3225. Cái này mua kèm với mainboard (là cái tôi thích) để được giảm giá.

4/ Bo mạch chủ và các loại card dùng cho hệ thống lưu trữ





Nói về thị trường bo mạch chủ (motherboard hay tắt là mobo) ngày nay ta có cả một rừng, đủ các dòng loại thượng vàng hạ cám. Trừ phi bạn tận dụng lại máy cũ, còn nếu bạn không cẩn thận tính toán ngay từ đầu, nhiều phần ta sẽ lựa chọn sai mobo cho hệ thống lưu trữ mà việc khắc phục hậu quả sau này sẽ khó khăn, tốn kém và nhất là rất mất thời gian.

Có hai mục tiêu chính mà ta cần bám lấy ‘thắt lưng nó’ mà đánh tới tấp. Thứ nhất, mobo tính toán làm sao không biết, phải có đủ cổng để cắm các ổ cứng. Ví dụ, tôi sẽ lắp 40 ổ cứng, vậy mobo có bao nhiêu cổng Sata onboard rồi? Cần phải mua bao nhiêu card sata nữa? Mỗi card bao nhiêu cổng? (tương tự như phần hard drive, bạn không cần quan tâm là Sata II hay Sata III). Mobo sẽ đủ khe PCI để cắm các card này không? PCI loại gì? Express x 1, x 4 hay thường (màu trắng)? Thứ hai, hổng lẽ setup cái máy xong rồi ngồi ngắm? Vì nó sẽ đóng vai trò là máy cái của các loại máy trong nhà nên hệ thống lưu trữ này không những cần phải có đường nối với home network mà còn phải bảo đảm sao cho đường truyền có đủ băng thông (bandwidth) và ổn định cho vài máy trong nhà stream đồng thời cùng lúc mà không bị ‘cà giựt’.

Từ kinh nghiệm, bạn còn nhớ tôi đã hướng đẫn các bạn chọn case và CPU trước. Tại sao?

Từ việc chọn ra một cái case, bạn sẽ biết được mình có quyền mua được loại factor nào của mobo: ATX, micro ATX, mini ITX,… Cũng vậy qua cái case sẽ chứa được bao nhiêu HDD là tối đa, bạn cũng sẽ biết được mình sẽ mua mobo có khả năng (sau khi cộng hết tứ phương tám hướng gồm cổng onboard, sata cards qua slot PCI,…) cắm được bao nhiêu HDD. Cũng vậy, sau khi chọn xong CPU, bạn sẽ biết mobo của mình dùng cho AMD hay Intel, socket loại nào (cái này quan trọng lắm),… Lúc này công việc sẽ dễ dàng hơn một chút phải không các bạn?

OK, bây giờ để thực hiện mục tiêu số 1 ở trên, ta cứ đu đeo thằng chipset mà chọn mobo. Thật vậy, từ chipset bạn có thể biết được khả năng mở tối đa mà một mobo mang chipset đó có thể thực hiện được. Từ số cổng Sata 6Gg/s, số slot PCI express (cái này quan trọng để tính toán khi mua thêm card sata cắm HDD), cho tới số cổng USB 3.0, khả năng OC, khả năng đấu SLI/Crossfire, v.v…

Và cũng từ chipset, nguyên tắc chọn là chúng ta cũng cứ lần lần chọn mobo từ thấp đến cao (cái này cũng thích hợp khi áp dụng chọn bo mạch chủ cho HTPC). Ví dụ như chipset Intel Haswell hiện nay (từ thấp đến cao) là H81, H87 và Z87. Nếu như loại H81 không đáp ứng yêu cầu của mình thì mới bắt đầu nâng lên H87. Theo cá nhân tôi thấy, trong khi loại chipset H87 được cho là lý tưởng đối với phần lớn người dùng hiện nay, thì các bo mạch chủ với chipset Z87 hầu như luôn luôn là một sự phù hợp tốt hơn dành cho các loại server lưu trữ HD gia đình. Bởi vì do Z87 là chipset hàng đầu, nên các nhà sản xuất bo mạch chủ có xu hướng cung cấp thêm các cổng mà chúng ta sẽ không thấy trên các mobo của H87. Thật vậy, chỉ là thêm vài cổng Sata onboard là đỡ cho chúng ta rất nhiều. Đồng ý là các bạn cũng có thể mua về card sata rời, nhưng ngoài sự mất thêm tiền mua card (không rẻ), vì xác xuất lỗi của card cũng cao, nên vô hình trung các bạn đang làm cho hệ thống gia tăng khả năng mất ổn định. Hy vọng không ai bị ‘bơi’ khi đọc tới đây 

Đối với phần network - mục tiêu số 2 – tức bảo đảm đường truyền network phải nhanh và ổn định. Lý ra tôi muốn dành hẳn một phần để chỉ nói riêng về nó do tính chất quan trọng trong việc stream content trong mạng gia đình nhưng phần vì nó có dính dáng đến bo mạch chủ phần vì bài nói về hardware đã quá dài nên tôi cũng muốn rút gọn lại.

Cái gì quan trọng trước nói trước. Đầu tiên tôi không bao giờ dùng wifi để stream bluray movies over home network. Đó là một ý tưởng tồi và nó đốt của tôi vài tháng mày mò cũng như tiền bạc để khắc phục cái tật ‘cà giựt’ mà cuối cùng tôi cũng đành bỏ cuộc. Vì lẽ đó, kinh nghiệm của tôi là, không bao giờ cho phép mình mua cái mobo có tích hợp (built-in) wifi dùng cho hệ thống lưu trữ. Cái dại là mình ngoài việc phải bỏ tiền thêm mua cái ‘cục nợ bán kèm’ mà còn hao thêm tí điện, sinh thêm tí nhiệt trong khi lại không sử dụng được cho dù là chuẩn wifi n đi nữa. Riêng về chuẩn wifi AC mới hiện nay, tôi được khuyên phải ‘chơi hàng’ cho tới thì sẽ stream được. Nhưng ngồi nhẩm ra vừa sắm lại rounter vừa mua adapter mới bắt wifi cho ‘đúng điệu’ tôi phải bỏ ra trên $400 thì tôi cuối cùng đành phải bỏ của chạy lấy người! Thôi cứ đi dây CAT 6 trong nhà, đẹp thì không sure nhưng rẻ và bền là chắc rồi.

Kế tiếp là từ đây sắp tới nếu bạn nghĩ sẽ cặp kè vĩnh viễn với một hệ thống lưu trữ HD vài chục terabyte trở lên thì chơi Gigabit LAN là sự lựa chọn đúng đắn nhất. Cái này thì quá dễ rồi nên tôi không thể nói thêm được gì nữa.

Một câu hỏi đặt ra khi quyết định dùng wired cable cho network là các loại chip thì dùng Gigabit Ethernet LAN chip của thương hiệu nào? Realtek, Marvell, Broadcom hay Intel là những cái tên phổ biến hiện nay? Trừ phi bạn đang sử dụng cho một máy tính gia đình thông thường thì không quan tâm lắm, còn không khi bạn đang sử dụng máy tính của bạn với mục đích như là một máy chủ chuyên dụng share phim, nhạc, hình ảnh cho cả gia đình với kết nối siêu nhanh thì tôi chỉ có thể nói một câu: Hãy làm bạn với Intel, bạn sẽ không bao giờ thất vọng. Ngoài cái chuyện truyền tải nhanh, driver mạnh mẽ và thân thiện, ít hao điện hơn, nó còn cho ta sự ổn định cao là cái tôi rất cần.

Trở lại về đề tài bo mạch chủ, ta nên mua loại NIC onboard hay mua NIC card rời? Dĩ nhiên là nếu có thêm tí tiền rủng rỉnh thì nên mua card rời. Điều thì dân rành tí về hardware ai cũng có thể trả lời được. Lý do là vì, tương tợ như video card rời, khi hoạt động card rời sẽ làm giảm tải hệ thống. Tôi có thể giới thiệu cho bạn, nếu có thể được thì mua cái NIC card Intel này. Nó mang đúng nghĩa rẻ, nhanh, bền.
Em nó là Intel EXPI9301CTBLK Network Adapter 1000Mbps PCI-Expressx1




Tuy nhiên được cái này thì mất cái khác, dùng card rời đồng nghĩa với việc mobo sẽ mất đi một khe cắm PCIe. Ngoài ra bình quân cứ 1 card rời được gắn vào hệ thống, nó sẽ tiêu tốn khoảng 10W/h. Vì vậy quyết định là tùy tình hình và tùy ý thích của các bạn thôi. Riêng cái media server của tôi thì chọn NIC Intel onboard. Xem hình.





Cuối cùng nên chọn thương hiệu bo mạch chủ nào? Vì hệ thống cần sự ổn định nên 2 cái tên tôi ưa thích xưa nay là Asus và Gigabyte. Sau này có thêm AsRock, tuy Bios và cài đặt hơi rối nhưng được cái giá mềm cộng thêm với một vài tính năng đáng giá khác nên cũng được đưa vào danh sách lựa chọn.

Túm (cái váy) lại, một số điểm cần chú ý khi lựa chọn motherboard:
- Thông thường các hệ thống lưu trữ sẽ có nhiều HDD, kiếm loại mobo nào có càng nhiếu cổng SATA onboar càng tốt (thường là 8 còn cao hơn thường khó kiếm và có giá trên trời).
- Có thế sau này sẽ nâng cấp lắp thêm nhiều HDD, kiếm loại mobo nào có càng nhiếu slot PCI (express) càng tốt (để gắn thêm SATA controller card).
- Sau này rất có thể sử dụng ổ USB gắn ngoài, do đó nên kiếm loại mobo được trang bị cổng USB 3.0 giúp tăng tốc độ truyền tải dữ liệu. Chứ các loại phim Bluray vài chục GB mà gắn USB 2.0 chắc copy tới thiên thu.
- Tôi khuyên các bạn nên mua loại mobo ATX dùng cho các loại máy lưu trữ dữ liệu. Các cổng có nhiều mà không gian cũng thoải mái để cài cắm. Có nhiều lựa chọn hơn đặc biệt so với loại bo mạch chủ miniITX.
- Nếu cái túi cho phép nên chọn thương hiệu được nhiều người tin cậy để có gì tối ngủ đỡ hồi hộp.


Sata Controller Card

Card Sata rời là loại card cho phép người dùng có thể gắn thêm HDD (thường là 2, 4, hoặc 8 ổ cứng) ngoài cổng Sata onboard. Loại khá phổ biến do giá cả bình dân và đặc biệt là độ bền cũng như tính ổn định của nó là card 8 cổng Sata Supermicro AOC-SASLP-MV8 8-Port SAS/SATA. Một vài bạn ở box lưu trữ khủng theo tôi biết cũng đang xài nó. Tôi có 3 em này hiện đang chạy trong server lưu trữ của tôi mấy năm nay mà xem ra cũng chưa thấy em nào tỏ ra mệt mỏi.
Ngoài trong giới giang hồ lưu trữ hồi đầu năm 2013 bắt đầu tán tụng loại sata card của IBM đó là IBM M1015 SAS/SATA Controlle (cũng là loại 8 port). Xem hình.





Mua trôi nổi trên eBay rồi về flash Rom lại nghe nói cũng tốt chán. Tôi chưa có dịp thử, hay chính xác hơn là không cần nên chỉ biết để đó. Nếu bạn nào đã có dùng qua loại này rồi thì có thể qua topic này nêu lên kinh nghiệm và cảm nhận của mình. Xin cám ơn.

Và sau đây là chi tiết về cái bo mạch chủ mà tôi đã trang bị cho hệ thống của mình. Tôi đã chọn cho cái mobo là ASUS P8Z77-V LGA 1155 Intel Z77 HDMI SATA 6Gb/s USB 3.0 ATX Intel Motherboard với 8 cổng Sata onboard.





Với 3 cái slot PCIe (2x8 và 1x4) dùng để cắm 3 em Supermicro AOC-SASLP-MV8. Ngoài ra tôi còn sử thêm 2 card Sata rời nữa (mỗi card có 4 cổng Sata – 1 PCIex1 và 1 PCI). Tổng cộng là 40 cổng Sata cho đúng 40 ổ cứng.




5/ Bộ nhớ hệ thống (RAM), bộ nguồn (PSU) và các thứ linh tinh

RAM

Nói về ram dành cho hệ thống lưu trữ dữ liệu HD, ta chỉ cầu lưu lý vài điểm sau đây:

- Vì máy không dành cho ép xung nên ram (loại DDR3) hiện nay chỉ cần tốc độ DDR3 1333 hay 1600 tùy theo loại chipset mà bạn đang có là quá đủ. Ai muốn mua loại có volt thấp cũng tốt để tiết kiệm điện nhưng loại này thường có giá cao nên xem ra không có hiệu quả kinh tế lắm.

- Trái lại, vì hệ thống sẽ chạy software Raid nên nó sẽ cần nhiều ram. Cách tính đơn giản như sau: Không tính phần Ram dành để chạy thường trực các phần khác trong máy, khi chạy Raid cứ mỗi 10TB HDD sẽ cần khoảng 1GB memory. Bị vì lóng rày giá ram mắc quá, nghe nói còn tăng nữa trong năm mới này, nên hệ thống của tôi hiện giờ mới chỉ có 8GB thôi. Đang ước có một cặp 2x 8GB ram là tuyệt vời. Nếu bạn bị tạm thời “kẹt đạn” không thể upgrade thêm ram thì tôi sẽ chỉ cách khắc phục khi nói về Raid.

- Đứng dưới góc nhìn của người lưu trữ dữ liệu, chất lượng ram có ảnh hưởng trực tiếp (nhưng ngầm bạn sẽ không thấy rõ) đến chất lượng của dữ liệu mà bạn đang lưu trữ đó. Các lỗi về dữ liệu (chẳng hạn như bit rot – nếu bạn chưa đọc thì nên dành chút thời giờ đọc qua cho biết) thường gặp nếu do Ram chạy không ổn định (bị leak). Do đó, chịu mắc chút, cá nhân tôi thường chọn Gskill, Corsair là 2 cái tên nghe là cho cảm giác rất yên tâm rồi. Kẹt quá thì đi với thằng Kingston, Crucial, Adata, Mushkin, Super Talent. Nếu bạn có kho dữ liệu không dưới 20TB và cực kỳ yêu quý nó , tuyệt đối không chơi với mất em Ram Tàu no name.

Dưới đây là cặp ram Corsair 2x4GB DDR3 1333 tôi đang sử dụng.



Quạt


Thông thường khi nói về phần cứng, tôi thường hay thấy phần quạt bị bỏ qua một cách đáng tiếc. Nếu bạn biết rằng gần 1/3 nguyên nhân gây hỏng hóc máy tính là do quạt (hoặc có dính dáng đến quạt) thì chắc hẳn bạn sẽ có cái nhìn khác về nó.
Nếu bạn chịu khó để ý kỹ một chút thì sẽ thấy không có cái quạt nào giống cái nào. Nhưng tựu chung nhà sản xuất quạt máy tính ngày nay thiết kế 2 dòng quạt chính: Loại standard và loại Performance.
Loại standard thường dùng chung chung cho case, quay ở tốc độ thấp thường ở khoảng 1500 rpm trở cuống và cũng vì vậy lưu lượng gió thấp (ít mát) nhưng đổi lại êm ái không ốn ào. Loại quạt performance thì thường bố trí để làm mát các bộ phận sinh nhiệt lớn trong máy. Do đó tốc độ khá cao (trên 2000 rmp), để tay thấy mát rõ ràng, hao điện hơn, chỉ cần một vài em chạy thì ngồi kế bên nghe cứ tưởng đang ngồi trong chiếc xe tăng !?!?. Bạn có thể xem hình (qua nhãn nhà sx) để có thể phân biệt các loại quạt.






Ngoài ra người ta còn có cách chia case fan theo bạc ổ (bearing) mà loại phổ thông nhất là loại sleeve bearing, rồi đến ball (chịu tốc độ nhanh), loại hydraulic (high performance) dùng quạt cho các bộ giải nhiệt nước (thường ~2500 rpm)

Nguyên tắc chọn quạt.

- Quạt càng lớn (đường kính) thì càng mát, chạy càng êm nhưng hao điện và có giá thành cao. Tôi rất thích các loại quạt 140mm và 200mm, chúng chạy rất êm và mát kinh khủng. Tuy nhiên cũng tùy tình hình là case của mình không gian có cho phép lắp được chúng hay không. Vâng, một lần nữa, càng to càng tốt.

- Nếu chỉ dùng quạt để giải nhiệt cho HDD thì kiếm loại nào có tốc độ càng thấp càng tốt để tránh tiếng gió ồn. Một vài cái không sao chứ trên 10 cái (trường hợp của tôi là 15 cái nếu tính luôn quạt của CPU) thì tình hình sẽ khác dữ lém. Còn nếu vẫn còn thấy ồn thì buộc phải giảm tốc độ quạt thôi. Ở đây để giảm tốc độ quạt ta có nhiều cách: qua BIOS, qua phần mềm chuyên dụng, qua bộ điều biến điện, và qua cách đấu dây lại. Trong khi chỉnh tốc độ quạt qua Bios và phần mềm còn nhiều hạn chế về mức độ phổ quát, bộ điều biến điện giá còn cao, thì xem ra việc đấu dây lại nhằm giảm điện thế vào quạt (làm giảm tốc độ quạt) hiện nay vẫn là cách tốt nhất, rẻ tiền nhất nhằm giảm độ ồn và mức tiêu thụ điện khi có nhiều quạt chạy trong một hệ thống nhiều HDD.

- Nhãn hiệu ở đây theo tôi là không quan trọng lắm, có chăng là độ bền mà thôi. Có thể là thương hiệu càng có tiếng như Corsair, Thermaltake, hay Antec, kém hơn chút là Cooler Master, Rosewill thì độ bền càng lâu? Một đời mình mấy chục đời nó, thông thường quạt thường đi theo case. Khi cái case hư cũ giụt đi cũng là lúc cho mấy cái quạt nghỉ hưu là vừa.

PSU (Power Supply Unit)

Trong tiếng Anh có câu Last but not least. Vâng thằng PSU là quan trọng lắm nhưng tại sao tôi lại để nó cuối cùng trái với cái rule của tôi? Đó là vì sau khi tính toán hết số lượng và chủng loại của tất cả các thiết bị sử dụng điện trong hệ thống lưu trữ cùng với ước lược mức tiêu hao điện của chúng, khi đó ta mới có cơ sở dữ liệu chính xác để mua một PSU đúng công suất thiết kế của hệ thống.

Tại sao tôi lại nói PSU quan trọng. Nếu bạn năn nỉ giảm chất lượng của cái này cái kia để có đủ tiền mua thì có thể được, nhưng riêng với thằng PSU thì đừng hòng. Tôi đã từng chứng kiến một thằng PSU cùi (no name) nhai gỏi cùng một lúc vài em HDD trắng trẻo xinh đẹp trong chớp mắt. Bản thân nó cùi nên quy tiên sớm cũng không nói làm gì, đằng này nó lại lôi kéo người khác chết chùm theo nó là điều không thể chấp nhận được. Vì cái hệ thống lưu trữ của tôi cũng chạy trên Raid. Mà như các bạn biết (nếu chưa biết thì giờ biết), loại Raid nào cũng có tử huyệt của nó. Do đó PSU phải là một trong những cái giáp sắt che chắn tử huyệt Raid của tôi. Cũng vì vậy chất lượng của PSU phải là tiêu chuẩn hàng đầu khi chọn mua PSU.

Thế nhà sản xuất nào (tôi không nói nhãn hiệu) thì chất lượng đây? Theo kinh nghiệm cũng như theo phản hồi của số đông các cao thủ lưu trữ, Seasonic hiện là nhà sản xuất được tín nhiệm nhất về PSU. Kế tiếp đó là Corsair. Ngoài ra còn có vài cái tên đạt chất lượng khác như XFX, PC Power and Cooling, ... nhưng thật ra cũng được sản xuất (hoặc công nghệ) bởi Seasonic mà thôi.

Còn tính toán công suất thì sao?

Nhớ lại trong mấy ngày đầu tập tành luyện võ nghệ, lên mạng thấy các cao thủ luyện công trên các em PSU từ 1000W trở lên, nhìn mà xám hồn. Sau tầm sư được cái link này (tôi nghĩ anh em ở đây cũng có người biết rồi) mới thấy nhẹ gánh phần nào khi tính toán công suất cho PSU. Nhớ phải nhập đủ số lượng và chủng loại thiết bị mình hiện có. Càng chính xác thì con số cho ra càng gần với thực tế.

Còn nếu tính phóng theo kiểu nhà quê thì tính vầy. Cái CPU vài chục W tùy loại nào, 1 cái card gắn vô là 10W, 1 cái HDD (lúc chạy) 15W, lúc say sưa giấc nồng là 5W, 1 cái quạt 120mm 5W. Rồi Ram, mainboard (trên đó có NIC và video onboard) cũng thêm vài chục W nữa tùy. Vị chi là 1 con số X nào đó + thêm khoảng 10% đến 20% dung sai công suất bảo toàn là cho khi máy được boot lên (khởi động) công suất tiêu thụ điện tăng cao đột biến trong thời gian ngắn (vài giây). Ở đây, tôi chỉ có thể đưa ra con số chung chung thôi, rất khó nói chính xác. Bản thân tôi cũng cón tính lộn (mua 850W thay vì 750W là cũng ngon cơm rùi). Nhưng nếu có tính lộn thì phải lộn lên, tức dư dư một chút. Chứ tính lộn thiếu nếu trả lại được là may, còn không mua thêm 1 cái PSU nữa chắc tức cắn lưỡi quá. Nếu bạn đã làm qua nhiều lần thì thấy đơn giản lắm, còn chưa thì… giờ tập đi cho biết!

Nếu bạn mua được loại Modular thì tốt, còn không thì thôi. Chủ yếu là nhằm bớt được dây nhợi lòng thòng trong case giúp case thông thoáng càng nhiều càng tốt, đồng thời nhìn bên trong cũng thấy case gọn gàng đẹp mắt nữa.

Khi nói về PSU ta sẽ có một đề tài rất lý thú khi nhắc tới đó là 80 PLUS Certified. Tuy nhiên vì lượng thông tin về đề tài rất nhiều nên tôi hy vọng (nếu có thời gian) sẽ viết riêng hẳn 1 bài về nó. Vâng, vì hệ thống lưu trữ HD của chúng ta nhiều phần sẽ chạy 24/7 và chứa dữ liệu quý nên gần như bắt buộc PSU của nó phải có gắn mạc 80 PLUS Certified tệ lắm cũng phải là Bronze. Có điều kiện thì chơi luôn Gold hay Platium. Cái này nhằm vừa tiết kiệm công suất tiêu thụ điện theo hiệu suất nhà sản xuất thiết kế vừa bảo đảm cung cấp nguồn điện sạch (giảm thiểu nhiễu) và ổn định nguồn vào (quan trọng lắm luôn).

Tôi hiện đang sử dụng SeaSonic X Series X-850 (SS-850KM3 Active PFC F3) 850W ATX12V v2.3 / EPS 12V v2.91 SLI Ready CrossFire Ready 80 PLUS GOLD Certified Full Modular Active PFC Power Supply New 4th Gen CPU Certified Haswell Ready.




Dĩ nhiên vì có quá nhiều ổ cứng Sata trong hệ thống, nên một PSU cho dù thuộc hạng cao cấp có nhiều và đầy đủ loại các đầu cắm cũng không thể nào cung cấp xuể vài chục cổng power được. Các bạn buộc phải mua thêm dây chia cổng power thôi. Ở các cửa hàng thì tôi không chắc (nên hỏi qua anh em nào biết), còn trên mạng thì cũng có bán nhiều các đầu chia Sata. Tôi thì sử dụng loại này cũng mua từ trên mạng xuống.




Nếu bạn để ý một chút thì sẽ thấy tôi nói PSU là một trong những bộ giáp sắt che chắn tử huyệt của hệ thống lưu trữ dữ liệu HD, bạn có thắc mắc những bộ giáp (phần cứng) khác là gì, ở đâu? Đó là cái UPS (hay còn gọi là battery/flywheel backup) và Power Surge Protector.

Bạn cũng biết UPS là một bộ lưu điện nhằm cung cấp điện khẩn cấp cho hệ thống một khi nguồn điện chính bị sụp bất tử. Một UPS khác với một máy phát điện dự phòng hoặc hệ thống điện dự phòng ở chỗ là nó luôn ở trạng thái chế độ chờ và khi cần nó sẽ cung cấp sự bảo vệ gần như tức thời từ sự gián đoạn điện vào của nguồn chính bằng cách cung cấp năng lượng được lưu trữ trong pin của nó. Mặc dù là thời gian nguồn điện liên tục chạy trên pin của hầu hết các UPS tương đối ngắn ( chỉ vài phút đến vài giờ tùy) nhưng đủ để ta khởi động nguồn phát dự phòng hoặc tắt hoàn toàn các thiết bị trọng yếu của mình.

Một UPS thường được sử dụng để bảo vệ trung tâm dữ liệu, thiết bị điện tử, viễn thông , thiết bị điện khác, đặc biệt là các phần cứng bên trong máy tính, nơi mà một sự gián đoạn điện đột xuất có thể gây ra hư hỏng nghiêm trọng hoặc mất dữ liệu. Thế một hệ thống lưu trữ dữ liệu có cần một UPS hay không? Tôi cho là cần, đặc biệt là ở các máy Nas khi các ổ cứng trong Raid chạy cùng lúc. Tuy nhiên đây cũng là con dao 2 lưỡi nếu ta tính toán công suất của UPS không chuẩn xác. Tức nguồn pin không đủ khỏe để kéo tải hệ thống. Máy của tôi hiện không xài UPS, vì tôi cần có thời gian nghiên cứu thêm.

Như tôi có nói trong phần PSU, dù phần nhiệt hoặc cơ có vấn đề nó cũng không giết HDD hàng loạt như điện, đặc biệt là sốc điện. Một cú sét đánh, hoặc đường dây chạm mạch khi trời mưa gió gây tăng dòng đột ngột trong nguồn điện cung cấp có thể đánh gục hàng loại HDD trong nháy mắt. Dĩ nhiên nhà đèn họ cũng có các thiết bị bảo vệ, nhưng ai dám bảo đảm 100% là an toàn trong tình hình chất lượng hiện nay và đưa đầu chịu báng khi hàng loạt các thiết bị điện/ điện tử của các hộ gia đình bị hư cháy hay không? Hãy cứu lấy mình trước khi trời cứu cho dù xác xuất trên chỉ vài phần trăm. Không bao nhiêu tiền, nhưng bảo vệ khá hiệu quả, tôi khuyên bạn nên sắm một cái Surge Protector. Nó thoạt nhìn không khác gì các ổ cắm điện thông thường nhưng là một thiết bị được thiết kế để bảo vệ các thiết bị điện từ sự tăng đột biến điện áp. Nó cố gắng khống chế điện áp cung cấp trong mức cho phép đến một thiết bị điện bằng cách ngăn chặn hoặc tiếp mát ngay lập tức khi gặp bất kỳ điện áp không mong muốn vượt ngưỡng an toàn. Nên kiếm một thương hiệu có uy tín để mua trong trường hợp này.

Tôi hiện đang sử dụng thằng Belkin 12 ổ cắm dùng chung





Phần kết luận

Để kết luận, thiết nghĩ tôi cũng nên nói vài điều khi kết thúc phần 1 (phần cứng – hardware), để không có một vài câu hỏi của anh em chưa được trả lời còn khó chịu trong lòng mà bản thân tôi cũng thấy áy náy nữa.


1/ Như đã nói ở đầu, vì trình độ anh em mình trong diễn đàn mỗi người mỗi khác, do đó có vài người đã quá giỏi trong nghề nên biết rành sẽ cảm thấy bài gì mà dài lê thê. Trong khi số khác lúc hiểu, lúc “bơi”. Tôi đã cố gắng trung dung dữ lắm để không ai cảm thấy nản “khi bơi” hoặc nhàm khi đã quá biết. Cũng mong mọi người tỏ ra thông cảm và góp ý thêm với tôi về điểm này để các phần sau được viết với dung lượng thông tin vừa cho đa số anh em nhất.


2/ Xin nhắc lại, tôi viết bài không nhằm khoe kiến thức hay khoe của, mà mục đích chính là trình bày, chia xẻ lại kinh nghiệm thành công cũng như thương đau mà anh em mình hay nói giỡn với nhau là “thú đau thương” hay “học phí” để mọi người nếu có cùng hoàn cảnh sẽ tiết kiệm thời gian mày mò tìm kiếm, tránh được chuyện mất tiền nhiều khi vô lý chỉ do mình không biết. Trên nguyên tắc đó, nếu mọi người dể ý sẽ thấy, tôi đã trình bày các nguyên tắc lựa chọn chung về các thiết bị bên trong một hệ thống lưu trữ nho nhỏ dùng trong gia đình. Nào là đầu tiên phải tính toán như thế nào cho chính xác, mua thứ gì lắp cho hợp lý, tại sao và ... tại sao. Tôi không bao giờ giúi vô tay bạn bất cứ món gì rồi biểu ra đi mua cái giống vậy mà không có bất cứ lời giải thích nào.
Bây giờ có thể bạn tìm được, mua được nhưng sau một vài tháng hoặc đến năm sau hàng không nhập về nữa hoặc nhà sx discontinued nên không thể kiếm ra thì sao? Khi bỏ công ra ngồi viết, ước muốn nhỏ nhoi của tôi là những kinh nghiệm ấy vẫn hữu ích cho các bạn vì lý do nào đó chậm chân đến sau (vài ba năm sau ví dụ vậy) vẫn có thể học hỏi kinh nghiệm từ những bài này mà tìm mua, sử dụng các thiết bị phần cứng phù hợp, rẻ tiến.


3/ Một vấn đề nổi cộm râm ran thảo luận cho đến phút cuối đó là tính hiệu quả khi thiết lập một hệ thống lưu trữ dữ liệu HD trong gia đình. Chúng ta nên nhận ra một điều căn bản ngay từ đầu là đề tài này nó mang hơi hướng nặng về sở thích riêng tư cá nhân khá nhiều. Cũng là từ nhà đến chợ Bến thành, có người đạp chiếc xe đạp cọc cạch cũng vẫn thấy đời phơi phới vui tươi, nhưng có người sẽ cảm thấy cả một bầu trời tối đen như sắp tận thế tới nơi khi không có chiếc SH lái đi. Anh em sinh đôi còn khác tính huống chi cả trăm, cả ngàn người dĩ nhiên sẽ khác nhau khi tính toán trong đầu và build cho riêng mình một cái home media server chứa phim, nhạc,... để giải trí dựa trên sở thích cá nhân của mình. Do đó ta không thể áp dặt ý muốn của mình lên người khác, control người khác. Như vậy là phi lý và bất công.

Lỡ nói thì nói luôn cho rồi. Cá nhân tôi cũng thuộc thành phần lao động làm công ăn lương, tháng nào xào tháng đó. Cái hệ thống của tôi, như đã nói, đâu phải một sớm một chiều là có mà là được gầy dựng trong những năm tháng dài ky cóp từng chút một. Cũng cân nhắc thiệt hơn dữ lắm. Chứ tiền đâu mà bỏ một lúc vài ngàn đô chỉ để mua linh kiện về ráp? Tôi cũng như đa số các bạn ở đây đam mê phim ảnh tích trữ phim qua bao nhiêu đời case/ box mới ra như được hôm nay. Vậy tôi sử dụng nó như thế nào? Hệ thống lưu trữ của tôi mở lên vào nghững ngày cuối tuần bắt đầu từ tối thứ sáu. Khi mà mọi người trong gia đình tôi sau khi đi học, đi làm về có thời gian rảnh ở nhà để giải trí. Một cái script được viết ra để tự tắt cái home server này vào lúc nửa đêm chủ nhật. Còn ngày thường thì tôi đã có cái Nas nho nhỏ (6 HDD) chạy 24/7 đảm đương nhiệm vụ. Tuy vậy cũng không nhiều vì những buổi tối ngày thường trong tuần vợ chồng con cái thường dành thời gian cho nhau như cùng dùng cơm tối với nhau, cùng thảo luận về một đề tài nào đó trong ngày, giúp con làm homework ở trường, vv... đó là thời gian đặc biệt quan trọng trong ngày mà ai trong chúng tôi cũng quý nó và không muốn bỏ lỡ. Tôi muốn trình bày giờ giấc sinh hoạt gia đình riêng của tôi cũng như công suất tiêu thụ của hệ thống lưu trữ nhà tôi để bạn nào có thắc mắc thì nhẩm tính được một tháng tôi phải trả tiền điện cho nó là bao nhiêu. Mặc dù, một lần nữa tôi xin nhắc, vấn đề thuộc về sở thích cá nhân và giải trí mà tính toán, cân đo đong đếm dữ quá thì không khôn ngoan tí nào.



Lúc máy nghỉ ngơi hoàn toàn



Lúc đang xem phim


4/ Cho những câu hỏi về giá cả và mua ở đâu, thì tôi xin trả lời ngắn gọn như thế này. Đa số các linh kiện là tôi lên mạng và mua online. Về giá thì có những cái tôi mua đã lâu sau vài lần đổi box dùng lại nên rõ ràng không thể nhớ giá được. Và điều quan trọng nhất là tất cả chúng tôi đều mua bên Mỹ nên dù các bạn có biết giá thì cũng chỉ mang tính tham khảo là chính, tôi không chắc ở VN sẽ có được giá đó không. Do tôi cũng là dân lao động nghèo nên mua sắm những thứ này cũng phải chờ lúc nó sale mới dám rớ, nếu không thì cũng phiền với bà xã lắm (người vợ nào mà không dè xẻn tằn tiện khi chăm lo cho gia đình phải không các bạn?).
Còn như các bạn vẫn cố muốn biết giá thì tôi xin liệt kê những thứ tôi còn nhớ mang máng như sau:

Ổ cứng 2TB: thường từ $60 - $65
Ổ cứng 3TB: không nhớ rõ nhưng không quá $80 (còn thằng WD Red 3TB mua để test thì $90)







Ổ cứng 4TB: thường từ $120 - $130. Còn mấy thằng WD (mua để test) thì $140.
Case Lian Li hình như $180
PSU Seasonic 850W Gold: $100
Card SATA 8 cổng trung bình $100/cái
Mobo Asus và CPU Intel i3 mua theo cặp vì được giảm giá (chứ cũng ko muốn mua loại i3 chi cho hao tốn, chủ yếu nhắm đến cái mainboard), còn giá thì quên béng mất rồi.
Cặp ram Corsair 8GB $50 (Update: mới mua thêm cặp Adata 2x4GB DDR3 1600 $30 để thành 16GB đặng chạy Raid cho nhanh nhưng chưa có thời gian lắp vô)
Power Sruger Protector $10.
Dây nhợi phụ hợ thì chắc là không nhớ nổi rồi.

Bạn nào còn thắc mắc thì cứ tiếp tục đặt câu hỏi trong topic này, tôi hoặc các bạn khác ở đây nếu biết sẽ rất sẵn lòng giúp đỡ các bạn.

Chúc các bạn kiếm được cho mình một dàn cứng rẻ - đẹp - bền để build cho mình một hệ thống lưu trữ dữ liệu HD như ý.

Xin gửi lời cảm ơn đến tất cả các bạn đã theo dõi và nhiệt tình cổ võ tinh thần trong thời gian tôi viết bài này.
Sức người có hạn, nhân vô thập toàn, cũng chẳng khách sáo gì. Nếu bài này các bạn thấy có điều gì sơ sót (đặc biết là về các điểm kỹ thuật) thì xin vui lòng ra tay chỉ giáo để các phần tiếp theo, tôi sẽ cẩn thận hơn, sẽ càng được hoàn chỉnh.
Xin các bạn nhớ đón đọc phần 2 (về việc bảo vệ) và 3 (về việc quản lý) cho dữ liệu HD của mình.

Một lần nữa xin cảm ơn tất cả các bạn.