Lê Thị Cẩm Bình
author picture
Trình độ chuyên môn: Công nghệ thông tin
Chức danh: TS

Trang cá nhân: https://scholar.google.com/citations?view_op=list_works&hl=vi&user=BBVGTZEAAAAJ

<p><b>QUÁ TRÌNH CÔNG TÁC</b>:Từ năm 1997 đến nay: công tác tại trường Đại học Văn hóa Hà Nội.</p> <p><b>CÁC LĨNH VỰC NGHIÊN CỨU</b>: Truy vấn cơ sở dữ liệu đa phương tiện. Trí tuệ nhân tạo (Phân tích dữ liệu lớn).</p> <p><b>CÁC MÔN HỌC ĐANG GIẢNG DẠY</b>:Toán và tin học.</p>

Content Distribution

ABSTRACTS VIEWS

145

VIEWS & DOWNLOAD

44

Top Country : Vietnam

Showing results 1 to 10 of 10
  • Article


  • Authors: Lê, Thị Cẩm Bình (2023)

  • Dữ liệu lớn đến từ nhiều nguồn khác nhau, nhờ vào tốc độ phát triển đột phá của công nghệ số và đang gia tăng nhanh chóng trong những năm gần đây. Việc khai thác dữ liệu lớn hiệu quả giúp tạo ra các sản phẩm thông tin có giá trị cao. Do đó, vấn đề phân tích dữ liệu lớn là nhu cầu cấp thiết. Các kỹ thuật giảm chiều đã được nghiên cứu và ứng dụng trong nhiều kỹ thuật khai thác dữ liệu như phân loại và phân cụm dữ liệu, đặc biệt đối với dữ liệu lớn có số chiều thuộc tính hoặc kích thước lớn. Giảm chiều dữ liệu được sử dụng như là một bước tiền xử lý trước khi tiến hành kỹ thuật khai thác dữ liệu, nhằm mục đích đưa ra các kết quả chính xác hơn và cải thiện thời gian phân t...

  • Article


  • Authors: Lê, Thị Cẩm Bình; Ngô, Thành Long; Phạm, Văn Nha; Phạm, Thế Long (2021)

  • The ensemble is a popular machine learning technique based on the principle of divide and conquer. In data clustering, the ensemble aims to improve performance in terms of processing speed and clustering quality. Most existing ensemble methods face inherent complex challenges such as uncertainty, ambiguity, and overlap. Fuzzy clustering has recently been developed to handle data with many-feature, heterogeneity, uncertainty, and big data. In this paper, we propose an ensemble feature- reduction clustering model (EFRC) using advanced machine learning techniques. The EFRC model consists of three phases. First, the data is feature-reduced by a random projection. Then, the data is divided...

  • Article


  • Authors: Lê, Thị Cẩm Bình; Pham, Van Nha (2021)

  • Particle swarm optimization (PSO) is a population-based stochastic optimization algorithm. PSO was inspired by the natural behavior of birds and fish in migration and foraging for food. PSO is considered as a multidisciplinary optimization model that can be applied in various optimization problems. PSO's ideas are simple and easy to understand but PSO is only applied in simple model problems. We think that in order to expand the applicability of PSO in complex problems, PSO should be described more explicitly in the form of a mathematical model. In this paper, we represent PSO in a mathematical model and apply in the multivariate data classification. First, PSOS general mathematical m...

  • Article


  • Authors: Lê, Thị Cẩm Bình; Phạm, Văn Nha; Ngô, Thành Long (2021)

  • In modern data analysis, multi-source data appears more and more in real applications. Different data sources provide information about different data. Therefore, multi-source data linking is important to improve the processing performance. However, in practice multi-source data is often heterogeneous, un- certain, and large. This issue is considered a major challenge from multi-source data. Ensemble is a universal machine learning model in which learning techniques can work in parallel, with big data. Clustering ensemble has been shown to outperform any standard clustering algorithm in terms of ac- curacy and robustness. However, most of the traditional clustering ensemble approaches...

  • Article


  • Authors: Lê, Thị Cẩm Bình; Phạm, Văn Nha; Phạm, Thế Long (2021)

  • The development of information and com- munication technology has motivated multi- source data to become more common and publicly available. Compared to traditional data that describe objects from a single- source, multi-source data is semantically richer, more useful, however many-feature, more uncertain, and complex. Since tra- ditional clustering algorithms cannot han- dle such data, multi-source clustering has become a research hotspot. Most existing multi-source clustering methods are devel- oped from single-source clustering by ex- tending the objective function or building combination models. In fact, the fuzzy clus- tering methods handle the uncertainty data better than the ha...

  • Article


  • Authors: Lê, Thị Cẩm Bình; Phạm, Văn Nha (2021)

  • Abstract-Particle swarm optimization (PSO) is a population- based stochastic optimization algorithm proposed for the first time by Kennedy et al. in 1994. PSO was inspired by the natural behavior of birds and fish in migration and foraging for food. PSO is considered as a multidisciplinary optimization model that can be applied in various optimization problems. PSO's ideas are simple and easy to understand but PSO is only applied in simple model problems. Until now, the official mathematical model of PSO has not been presented. In this paper, will be re-present as a general mathematical model and apply in the multivariate data classification. First, PSO's the general mathematical mode...

  • Article


  • Authors: Lê, Thị Cẩm Bình; Pham, Van Nha (2020)

  • Multi-view clustering considers the diversity of different views and fuses these views to produce a more accurate and robust partition than single-view clustering. In this paper, we proposes a multi-view fuzzy co-clustering algorithm for high-dimensional data classification. We call MvFCoC algorithm. The proposed algorithm is demonstrated through experiments on benchmark data sets. The experimental results show that the clustering quality is better by evaluating using validity indexes in comparison with previous methods.

  • Article


  • Authors: Lê, Thị Cẩm Bình (2018)

  • Tốc độ phát triển đột phá của công nghệ số trong những năm gần đây như điện thoại thông minh, điện toán đám mây, Internet vạn vật, mạng xã hội, các dịch vụ online,... đã phát sinh một lượng dữ liệu khổng lồ và đến từ nhiều nguồn khác nhau, chủ yếu là từ các phương tiện truyền thông xã hội như Twitters, Youtube, Facebook; các giao dịch kinh doanh như Amazon, e Bay, giao dịch qua mạng hoặc giao dịch từ các thiết bị di động; các máy móc thu nhận dữ liệu như máy gia tốc hạt lớn của CERN, các thiết bị cảm biến,... Các dữ liệu này thường không có cấu trúc như các tài liệu, ảnh, video, audio, email, dữ liệu trên các trang web,.. Theo thống kê, chúng chiếm khoảng trên 80% các loại dữ liệu hiệ...

  • Article


  • Authors: Lê, Thị Cẩm Bình (2013)

  • Giấu tin là phương pháp nhúng hoặc làm ẩn thông tin trong một đối tượng thông tin khác. Đây là phương pháp đang được ứng dụng rộng rãi và đem lại hiệu quả thiết thực trong các ngành như: công nghiệp phần mềm, âm nhạc, phim ảnh, sách báo... Bài viết sau đây chủ yếu tập trung vào vấn đề ứng dụng giấu tin trong cơ sở dữ liệu đa phương tiện, nhằm mục đích bảo vệ sản phẩm văn hóa dạng kỹ thuật số như: bảo vệ bản quyền tác giả, phát hiện xuyên tạc thông tin, chống sao chép và bảo mật thông tin trên mạng internet nói riêng cũng như khi truyền thông tin nói chung.