ArticleAuthors: Lê, Thị Cẩm Bình (2023)
Dữ liệu lớn đến từ nhiều nguồn khác nhau, nhờ vào tốc độ phát triển đột phá
của công nghệ số và đang gia tăng nhanh chóng trong những năm gần đây. Việc
khai thác dữ liệu lớn hiệu quả giúp tạo ra các sản phẩm thông tin có giá trị cao.
Do đó, vấn đề phân tích dữ liệu lớn là nhu cầu cấp thiết. Các kỹ thuật giảm chiều
đã được nghiên cứu và ứng dụng trong nhiều kỹ thuật khai thác dữ liệu như phân
loại và phân cụm dữ liệu, đặc biệt đối với dữ liệu lớn có số chiều thuộc tính hoặc
kích thước lớn. Giảm chiều dữ liệu được sử dụng như là một bước tiền xử lý trước
khi tiến hành kỹ thuật khai thác dữ liệu, nhằm mục đích đưa ra các kết quả chính
xác hơn và cải thiện thời gian phân tích trong không gian dữ liệu nhiều chiều. Bài
viết trình bày các khái niệm dữ liệu lớn, kỹ thuật g...