Thứ Ba, 1 tháng 4, 2014

Big data

Quá nhiều tài liệu quá nhiều thông tin, một trào lưu của giới công nghệ. Ghi chép lại vài dòng để làm tư liệu cho bản thân về cái Big Data.





Big data là gì?

Một nhận định từ đầu, Big data cung cấp cho bạn một khả năng cực mạnh về thu thập và phân tích dữ liệu, khả năng mở rộng với một số lượng lớn các dữ liệu và chuyển đổi thông tin này giúp chúng ta có thể hiểu rõ hơn những gì đang xảy ra trên thế giới này. Khả năng của Big data có thể cho phép chúng ta ghi nhận lại và phân tích các đoạn mã ADN, tìm kiếm phương pháp chuẩn đoán các căn bệnh ung thư một cách nhanh chóng, dự đoán các hành vi của người tiêu dùng, chiến lược quản trị marketing với khách hàng, ngăn chặn các thiên tai có thể xảy đến, và còn nhiều nữa....

Thế giới dữ liệu rộng lớn

Ngày qua ngày, dữ liệu của chúng ta ngày càng lớn và phát triển rộng khắp, các dữ liệu mà ngay cả bản thân người dùng, người tham gia vào các hoạt động cũng không thể nhận ra đã được lưu trữ và được biên dịch lại thành một mớ bồng bông dữ liệu, chúng ta có thể xem một vài minh họa cho việc dữ liệu hiện tại của chúng ta được quản lý thế nào nhe.

- Trao đổi thông tin: Email một công cụ truyền thống và hữu dụng cho doanh nghiệp (được lưu trữ ở doanh nghiệp là chủ yếu), thông tin trao đổi nhau trên điện thoại
- Website - dữ liệu số: một thông tin khổng lồ được thế giới lưu trữ lại, khi bạn link đến một trang web thì được các website đó lưu lại bạn đã click vào cái gì, xem cái gì, mua cái gì, share cái gì, like cái gì trên cái trang của tui đó... khi bạn đọc sách điện tử thì tui lưu lại bạn đọc cái gì, khi bạn nghe nhạc thì tui lưu lại bạn nghe cái gì, khi bạn thanh toán bằng ebanking thì tui cũng lưu lại bạn đã giao dịch cái gì trong đó.
- Hình ảnh, phim: chui choa cái này thì khỏi phải nói rồi nhiều vô số kể, em chỉ cần có một con smartphone chộp cái bộp rồi up lên "mây" thôi. Phim tư liệu của các camera giao thông sẽ được lưu trữ như thế nào? Thiệt là tình em không dám nghĩ cái Youtube nhà ta đang lưu được bao nhiêu video nữa, chèn ơi... còn like của facebook thì không dám nói luôn...
- Doanh nghiệp: trong doanh nghiệp thì lượng dữ liệu được nằm trong các ERP, CRM, HRM,... chúng được tăng lên ngày qua ngày luôn, không thể nào biết được khi nào dừng lại.
- Còn về Sensor nữa chứ: muốn bêết mấy ông cầu thủ bóng đá chạy nhiều hay là chạy ít nào, biết thằng Nadal nó đánh vào cái gốc nào nhiều nhất cho một trận đấu tennis không? Làm sao theo dõi cái xe chở hàng của tui đang nằm ở đâu đây. Làm sao để cái xe hơi của em nó tự lái để cho em có thời gian mà đọc sách khi đi đến văn phòng? Đo nhiệt độ, sức gió để đứa con tinh thần MH370 của em nó không trở nên bí ẩn như hiện tại hỷ?

Rất nhiều thiết bị thông minh khác mà các hãng công nghệ còn đưa ra nữa ấy chứ. Trên là một số ví dụ minh chứng cho việc dữ liệu của chúng ta ngày càng lớn và phát triển một cách "tự nhiên" và chúng còn lớn nhanh hơn chúng ta nghĩ.

Big data không chỉ là dữ liệu "bự"

Sự phức tạp của chính dữ liệu tạo nên một thế hệ mới của chính bản thân dữ liệu nó tạo nên, có 4 chữ V để tạo nên cái sự khác biệt này so với dữ liệu thông thường, mà chúng ta hay gọi là Big Data.

- Volume: chắc chắn nó phải lớn mới gọi là big rồi
- Velocity: Tốc độ của truy xuất dữ liệu phải được quan tâm hàng đầu. Híc híc, em làm cái thanh toán bằng thẻ tín dụng của em, quẹt cái thẻ 3 ngày sau mới báo cho em biết là em bị trừ tiền. Lúc đó em không biết là cái gì đang xảy ra với cái tài khoản của em luôn. Em đi buôn "chứng", mua cái 3 ngày sau em mới nhận được xác nhận là em mua được "chứng" rồi. híc híc
- Variety: sự khác nhau của loại dữ liệu: hình, phim, dữ liệu ERP, CRM, HRM, sensor, ghi âm,...LOL hhaah)
- Veracity: sự lộn xộn như rau trộn nữa nhe: mấy cái ông mạng xã hội đó, mấy ổng feed link mấy ổng đẩy ra tùm lum món để mà làm việc. Mình vừa post cái ổng chuyển thành cái link quái gì đó chẳng hiểu.





Không có nhận xét nào:

Đăng nhận xét