Công nghệ

định nghĩa dữ liệu

Dữ liệu đến từ ngôn ngữ Latinh, từ "datum", và đề cập đến một đại diện thông qua số, chữ cái hoặc các ký hiệu khác về đặc tính của một cái gì đó. Ví dụ, chúng ta có thể nói rằng một cái gì đó, thực thể đó, là thời gian hiện tại và dữ liệu sẽ giống như 15:21 h.

Trong một chương trình máy tính, dữ liệu giờ hoặc hàng giờ có thể được chứa trong một biến. Một biến được đặt tên như vậy vì nó có dữ liệu thay đổi. Ví dụ: trong một chương trình, biến START_TIME có thể bằng 13, nghĩa là thứ gì đó bắt đầu lúc 1:00 chiều, trong khi biến END_TIME có thể chứa dữ liệu 17, nghĩa là thứ gì đó kết thúc lúc 5:00 chiều.

Khi đó, dữ liệu tự nó không có ý nghĩa gì, nhưng nếu nó được xử lý đúng cách, nó có thể được sử dụng để thực hiện các phép tính hoặc đưa ra quyết định. Do đó, thật thú vị khi phân biệt giữa các khái niệm "sự thật" và thông tin. Dữ liệu, như chúng tôi đã chỉ ra trước đây, không có ý nghĩa riêng của chúng, nhưng khi chúng được xử lý (sinh học, cơ học hoặc điện tử), chúng cho kết quả cuối cùng là một sự trừu tượng tự nó có ý nghĩa: thông tin. Trong một hệ thống sống, "dữ liệu" có thể là âm thanh do chuông báo động phát ra (bản thân nó chỉ là tiếng ồn), quá trình xử lý là sự xuất hiện của âm thanh được chuyển thành các xung thần kinh vào não, và thông tin cuối cùng là "thận trọng!" , như tâm trí của chúng ta diễn giải nó.

Như một ví dụ về xử lý kỹ thuật số của dữ liệu, một đồng hồ nguyên tử gắn với vệ tinh quay quanh trái đất thường gửi dữ liệu đến hệ thống GPS (hệ thống vị trí toàn cầu: hệ thống định vị toàn cầu). Trên Thiên văn vô tuyến một dạng rất chính xác của đo thời gian, và vì lý do này, có phần mềm miễn phí cho phép có được sự thật cung cấp đồng hồ nguyên tử của vệ tinh theo thời gian hiện tại và sử dụng lại nó để phân tích các thiên thể (hành tinh, tiểu hành tinh, v.v.) hoặc thậm chí các vệ tinh khác đang hoạt động hoặc không được sử dụng.

Phương pháp định lượng độ lớn của một phần dữ liệu (hoặc của thông tin tiếp theo phát sinh từ quá trình xử lý của nó) bao gồm hệ thống bit. Bit được gọi là dung lượng thông tin có thể truyền tối thiểu và thường được biểu diễn bằng một chữ số nhị phân (không hoặc một). Như vậy, câu hỏi "bạn có hiểu câu này không?" nó có thể tạo ra phản hồi một bit ("có" hoặc "không", 1 hoặc 0). Một octet 8 bit được gọi trong biệt ngữ là một byte. Từ đó, bằng cách sử dụng lũy ​​thừa của số 2, chúng được công nhận là đơn vị để định lượng thông tin thành kilobyte (KB, 1024 byte), thành megabyte (MB, 1024 KB hoặc khoảng 1 triệu byte), sang gigabyte (khoảng 1 tỷ byte) và các bội số liên tiếp của chúng.

Để xử lý lượng lớn dữ liệu này, cần phải có một hệ thống đủ dung lượng và tốc độ. Các đặc điểm mà thuật toán của một chương trình hoạt động là thể hiện qua dữ liệu. Mặt khác, cơ sở dữ liệu là cấu trúc lưu trữ trên máy tính, cho phép chúng ta truy cập thông qua tìm kiếm, được chia thành các trường và thường được tổ chức thành các bản ghi. Chúng ta có thể nghĩ về Internet như một cơ sở dữ liệu đáng sợ.

Cơ sở dữ liệu đã đơn giản hóa rất nhiều việc lưu trữ và xử lý nội dung này. Từ các chương trình thương mại đầu tiên dành cho công chúng đến các hệ thống chuyên nghiệp hiện đại cho phép thực hiện các phép tính thống kê phức tạp, cơ sở dữ liệu đã trở thành một công cụ xử lý chuyên biệt thực sự. Do đó, các mối quan tâm liên quan đến an ninh đã phát sinh, đã được giải quyết một phần thông qua việc mở rộng luật bảo vệ của dữ liệu (dữ liệu habeas) với các phương thức khác nhau trên khắp thế giới. Tuy nhiên, việc phổ biến dữ liệu cá nhân của công dân là chủ đề của các cuộc tranh luận và tranh luận, đặc biệt là liên quan đến các giới hạn được đưa ra đối với quyền riêng tư.

Theo cách tương tự, mạng xã hội được công nhận là cơ sở dữ liệu lớn, một công cụ không ngừng phát triển cho phép trao đổi thông tin trong thời gian thực giữa các cá nhân hoặc thực thể khác nhau. Mạng xã hội Facebook được ước tính là cơ sở dữ liệu lớn nhất trong lịch sử loài người, nhiều hơn tất cả các thư viện trên Trái đất nói chung.

$config[zx-auto] not found$config[zx-overlay] not found