[System Info] Phần 2 - Tôi đã bảo vệ hệ thống lưu trữ dữ liệu HD của mình như thế nào
Ngày nay, khi mà khối lượng thông tin của con người ngày
càng nhiều về lượng, phong phú về nội dung, đa dạng về hình thức thì
nhu cầu về lưu trữ và đặc biệt là bảo vệ chúng cũng càng trở nên cấp
thiết và nóng không kém. Hãy tưởng tượng một công ty đầu tư nước ngoài
vào làm ăn ở Việt Nam, cuối năm kết toán sổ sách báo cáo về công ty mẹ
xem lời lãi như nào. Nhưng rủi thay dữ liệu bị mất hết thì Giám đốc
công ty có đáng đem ra trảm không? Rồi ăn nói sao với cơ quan thuế vụ?
Càng vi tính hóa (paperless) thì càng chết nhiều. Còn riêng với anh em
HD thì nhu cầu bảo vệ phim, nhạc, dữ liệu như thế nào thì có lẽ tôi
không cần nhắc lại.

1/ Mất dữ liệu
Trước khi đi vào phần chính – phần bảo vệ dữ liệu HD, tôi nghĩ các bạn
cũng cần nên biết một chút về thế nào là mất dữ liệu. Vì có biết về mất
dữ liệu thì mới biết cách bảo vệ dữ liệu cho đúng đắn và hiệu quả. Cũng
như khi ra trận đánh giặc thì phải biết giặc là ai thì mới đánh được
chứ, chả nhẽ đánh vào không khí à? Có người nói tôi rườm rà, dài dòng,
nhưng tính tôi nó thế. Khi làm thì phải biết mình đang làm cái gì, kết
quả ra sao. Còn như không biết thì không làm, chứ không theo kiểu Thiên
Lôi ai sai đâu đánh đó. Mong các bạn thông cảm.
Mất dữ liệu được xem là một tình trạng lỗi trong các hệ thống thông tin
mà ở đó các dữ liệu bị mất sạch, không còn được truy xuất được nữa.
Điều này xảy ra có thể trong quá trình thực thi tác vụ, truyền tải hoặc
lưu trữ.

Ta phải cần phân biệt một điều là mất dữ liệu nó khác với trường hợp dữ
liệu không sẵn sàng để sử dụng. Ta lấy ví dụ khi bạn đang xem phim qua
Youtube giữa chừng thì bị đứt mạng. Bạn có thể truy cập được dữ liệu để
coi tiếp không? Dĩ nhiên là không rồi, nhưng bạn có cho rằng bị mất dữ
liệu không hay chỉ tạm thời thôi rồi khi nào nối mạng lại thì xem được
tiếp?
Mặc dù cả hai trường hợp trên đều cho những hậu quả tương tự cho người
dùng, tức không truy xuất được dữ liệu, nhưng dữ liệu không sẵn sàng
chỉ mang tính là tạm thời, trong khi mất dữ liệu có thể được coi là mất
vĩnh viễn.
Ngoài ra còn một trường hợp mất dữ liệu nữa mà ta thường hay nghe, đặc
biệt trên các báo đài. Mất dữ liệu ở đây thật ra không phải là người
chủ dữ liệu đó bị mất (vẫn còn nguyên vẹn trong tay ấy chứ) mà là các dữ
liệu (nhạy cảm ấy) bị hack cho bên thứ 3 biết. Thiệt hại từ sự cố này
cũng đáng kể chứ chẳng chơi. Ví dụ như dữ liệu nhạy cảm về công nghệ chế
tạo máy bay tàng hình không người lái tác chiến trên tàu sân bay của
Mỹ mà rơi vào tay nước “lạ” xem, chuyện sẽ không nhỏ đâu. Hoặc như các
dữ liệu về hợp đồng mua bán thậm thụt với nước ngoài bị mất vào tay các
phương tiện truyền thông xem, sẽ có khối anh Giám đốc vào nhà đá gỡ
lịch hoặc về nhà đuổi gà cho vợ.
Các loại mất dữ liệu
Do hành động cố ý: Các dữ liệu bị xóa với sự chủ ý của người dùng.
Do hành động vô ý: gồm
- Tình cờ xóa một tập tin hoặc chương trình.
- Thất lạc phương tiện lưu trữ như ổ cứng, tape, đĩa CD hay thẻ nhớ
- Quản trị dữ liệu tồi
- Không đọc được dữ liệu chứa trong các định dạng lạ
Lỗi hư hỏng
- Mất điện , dẫn đến dữ liệu trong bộ nhớ tạm không được lưu kịp thời vào nơi lưu trữ lâu dài.
- Lỗi phần cứng, chẳng hạn như một vụ tai nạn của đầu đọc trong một đĩa cứng.
- Lỗi phần mềm bị sụp hoặc bị treo dẫn đến dữ liệu cũng không được lưu đúng đắn.
- Phần mềm bị lỗi trong quá trình viết hoặc khả năng sử dụng kém , chẳng hạn như không xác nhận lệnh xóa một tập tin.
- Dữ liệu tự nó bị hư hỏng ngầm – Xin xem về bài viết nói về Data Rot.
Các thảm họa
- Thiên tai, động đất, lũ lụt, lốc xoáy, v..v...
- Lửa
Tội phạm
- Trộm cắp, đột nhập, phá hoại, v..v...
- Các hành động ác ý chẳng hạn như lén lút thả virus, worm, và hacker
cũng như hành động trộm cắp các phương tiện lưu trữ vật lý.
Tóm lại, trong một nghiên cứu được đăng trên Wiki cho thấy lỗi phần cứng
và lỗi của con người là hai nguyên nhân phổ biến nhất gây mất mát dữ
liệu, nó chiếm khoảng ba phần tư của tất cả các sự cố mất dữ liệu.
Nguyên nhân nữa làm mất dữ liệu là các thảm họa tự nhiên. Tuy nhiên khả
năng mất dữ liệu do thảm họa tự nhiên là nhỏ. Cách duy nhất để chuẩn bị
cho một biến cố thương đau là mất dữ liệu, tôi và các bạn không biết
phải làm gì hơn là chủ động chọn cho mình một phương pháp hữu hiệu nhằm
bảo vệ lấy nhưng dữ liệu yêu quý của mình đã dày công sưu tầm trong
bằng ấy năm nay.
2/ Chọn lựa phần mềm – Software
- Bám vào các tiêu chuẩn khi chọn lựa: So với việc chọn lựa phần cứng
đòi hỏi sự tỉ mỉ cẩn thận ở bài 1, thì việc chọn lựa phần mềm ở đây khá
đơn giản. Tuy nhiên nó vẫn không kém phần quan trọng. Cũng giống như ở
phần cứng, ta vẫn phải bám chặt lấy những tiêu chuẩn được đề ra ngay từ
đầu. Tôi lấy vì dụ tại sao nó quan trọng. Tiêu chuẩn đề ra là khi nghe
nhạc hoặc xem phim thì một ổ cứng và chỉ có một ổ cứng làm việc thôi,
những cái còn lại phải ở trong trạng thái nghỉ. Nếu như tôi chọn
standard RAID 5 thì coi như phá sản rồi chứ gì nữa?!?!
- Ngoài ra, do tính chất đặc thù của một hệ thống chỉ chuyên lưu trữ dữ
liệu, nên ta cố gắng càng ít cài các loại phần mềm vớ vẩn càng tốt. Chủ
yếu nhằm tiết kiệm tài nguyên hệ thống, máy khởi động được nhanh, ngoài
ra còn nhằm tránh các trường hợp xung đột phần mềm không đáng có.
Hệ Điều Hành
Dĩ nhiên rồi vì hệ thống lưu trữ nào mà không cần nó. Bạn có thể dùng
HĐH Windows hay Linux (2 loại thông dụng hiện nay dành cho lưu trữ) là
tùy nhu cầu, điều kiện và sở thích của bạn. Tôi chọn Windows vì sự phổ
dụng của nó đối với người dùng gia đình. Ngoài ra nếu mình bị bí thì
chạy lên mạng hỏi sẽ dễ được trả lời hơn. Giả dụ như tôi “lúa” không
biết cách mount ổ cứng thì trong Windows sẽ có nhiều người biết và dễ
dàng chỉ cho tôi so với Linux. Hay cái ổ cứng đã được format ở NTFS, thì
khi nhổ phăng từ máy chủ có thể đem đi cắm vào bất cứ máy dùng HĐH
Windows, khỏe re như bò kéo xe, khỏi lăn tăn suy nghĩ cách đổi định
dạng. Đó là tôi đang nói chúng ta – những người dùng gia đình thôi. Còn
đối với các doanh nghiệp lớn, lượng thông tin lưu trữ nhiều theo tôi
biết ít ai dám can đảm như chúng ta mà dùng Windows lắm. Một điều dễ
thấy là hệ điều hành mở quản lý dữ liệu mạnh mẽ và bảo mật hơn Windows
nhiều lắm luôn và vì không thuộc phạm trù bài viết này nên tôi không
tiện nói nhiều.
Đồng ý là Windows rồi nhưng mà là Windows gì? Theo kinh nghiệm cá nhân
tôi thì dùng Windows nào cũng được. Từ Vista, 7, 8 cho đến Server
Essential (thay thế cho WHS 2011), 2K3, 2K8, hay 2012. Nhưng ổn định
nhất (mà tôi cũng thấy nhiều người đang sử dụng là Windows 7 và Windows
Server 2012). Tôi hiện đang dùng Server 2012 (vì cho nó giống như mấy
cái server của tôi ở chỗ làm ..hì..hì..)
Nếu bạn để ý thì sẽ thấy từ đầu đến giờ tôi phần nhiều hay dùng từ ‘hệ
thống’ này ‘hệ thống’ nọ thay vì nói server cho nó gọn. Chỉ là một cái
máy lưu trữ thôi chứ có gì đồ sộ lằng nhằng ghê gớm gì đâu mà dùng từ
đao to búa lòe thiên hạ? Đó là do tôi đã tính trước sợ các bạn sẽ bối
rối hỏi tôi vậy server lưu trữ thì phải dùng Windows server thôi chứ
không được dùng các loại Windows khác hả.
Có người bảo tôi Windows server với cơ chế họat động chuyên biệt của nó
có thể không cần reboot trong nhiều ngày, thậm chí nhiều tháng. Tôi
biết và đồng ý chuyện đó. Tuy nhiên tôi có người bạn đang dùng Windows 7
để lưu trữ (xin nhớ chỉ dùng thuần túy lưu trữ à nghen) thế mà hơn 6
tháng không cần reboot vẫn chạy ngọt ngào phà phà. Còn như nếu bạn còn
dùng nó để search web, bittorent, mấy thứ linh tinh, thậm chí chơi game
thì tình huống sẽ khác.
Windows 32 hay 64 bit không quan trọng hay ảnh hưởng nhiều, nhưng do
việc tính toán RAID sẽ cần nhiều bộ nhớ (> 4GB nếu dung lượng lưu
trữ nhiều) khi tính toán parity nên tốt nhất bạn nên cài loại 64 bit.
Ngoài ra có nhiều bạn thích dùng remote desktop control để truy cập vào
máy từ xa (headless), trừ phi bạn sẽ dùng Windows Server, nếu dùng
Windows 7 hoặc 8 thì lần cài lần khó ta nên “chơi lun” từ loại Pro trở
lên.
Phần mềm bảo vệ dữ liệu
Để bảo vệ dữ liệu, như đã nói ở phần trên, ngày nay phổ biến có 3 cách
hoặc là dùng backup, hoặc là dùng RAID và hoặc là … dẹp đi hổng xài nữa
nên không cần bảo vệ (cái này mới chế ra…). Nói đùa vậy thôi, ít thì
được chứ nhiều dữ liệu quá (như phim HD chẳng hạn) thì dùng phương án
backup rõ ràng là không hiệu quả rồi. Xin xem những hạn chế của backup
trong bài “RAID bạn biết gì về nó”.
Còn đối với RAID thì sao? Lựa loại RAID nào? Để có được sự lựa chọn chính xác, tôi đã dùng phương pháp loại suy.
Trước tiên là Hardware RAID. Anh này khỏe mạnh, nhanh nhẹn, gọn gàng
rồi. Tuy nhiên vật cản lớn nhất là cái giá của nó. Vâng với cái giá
chát như vậy khó lòng mà một người dùng gia đình với tới được. Hoặc giả
có với tới được cũng … không ngu gì. Loại!
Còn Fake (hay Host) RAID thì sao? Những giới hạn cố hữu của nó là: thứ
nhất chết theo với firmware. Firmware của nhà sản xuất cho phép mình
thiết lập RAID như thế nào thì phải theo y chang như thế ấy, nếu có gặp
bug thì cũng ráng chịu. Khả năng bug được sửa vừa chậm vừa ít. Thứ hai
là chết theo board (ở đây là motherboard và card board Sata rời). Giả
như cái mainboard hay cái card rời chán sống muốn quy tiên sớm, bạn còn
không lo nhanh chân kiếm cái y chang vậy về thế liền. Nhưng nếu lỡ may
hàng không có (sau vài năm hết nhập về vì không lời, hoặc nhà máy ngưng
lâu rồi không sản xuất nữa), tôi chắc rằng có người đang kiếm cho mình
sợi dây đặng treo cổ chết cho rồi! Vâng, loại luôn.
Cuối cùng là software RAID. Nói về software RAID thì một rừng cũng không
khác gì thị trường smartphone ngày nay vậy. Vấn đề là lục trong đống
hổ lốn đó thằng nào là thích hợp cho yêu cầu của mình mới là quan trọng:
HTC One? iPhone 5S, Samsung Galaxy Note 3, hay Sony Xperia Z1…? Nếu
như bên smartphones sẽ có sự tranh luận nảy lửa khi bênh vực cho loại
phone mình đang xài thì bên software RAID cũng sẽ không khác gì.
Trên thị trường hiện này ngoài những software RAID được viết chuyên sâu
đặc biệt cho một phần cứng nào đó ví dụ như Synology, Qnap, Buffalo hay
cao cấp hơn dùng cho các doanh nghiệp là EMC, NetApp, DataDomain,...,
ta còn có các loại software RAID viết mang tính phổ thông, đa dạng và
tính tương thích cao đối với đa phần các loại máy lưu trữ gia đình.
Trong đó phải kể đến các bậc cao thủ đã và đang làm mưa làm gió như
unRAID, ZFS, FlexRAID, disParity,SnapRAID, Storage Spaces, and Btffs.
Dưới đây là bảng so sánh từng đặc điểm của chúng. Trong trường hợp bạn
sẽ lựa một trong chúng (tôi cũng đang xài một trong chúng) thì bạn sẽ
quyết định lựa thằng software RAID nào?

(còn tiếp)