Phân tích cụm

Tác vụ gom nhóm một tập các đối tượng mà để các đối tượng trong cùng một nhóm (hoặc cụm) sẽ có tính giống nhau hơn so với các đối tượng trong các cụm khác.Bản mẫu:SHORTDESC:Tác vụ gom nhóm một tập các đối tượng mà để các đối tượng trong cùng một nhóm (hoặc cụm) sẽ có tính giống nhau hơn so với các đối tượng trong các cụm khác.
Kết quả một phân tích cụm chỉ ra các hình vuông theo màu sắc được chia thành 3 cụm (nhóm).

Phân tích cụm (hay phân nhóm, gom cụm, tiếng Anh: cluster analysis) là một tác vụ gom nhóm một tập các đối tượng theo cách các đối tượng cùng nhóm (gọi là cụm, cluster) sẽ có tính giống nhau (theo các đặc tính nào đó) hơn so với các đối tượng ngoài nhóm hoặc thuộc các nhóm khác.[1][2] Phân tích cụm là một tác vụ chính của khai phá dữ liệu, và là một kỹ thuật phổ biến trong thống kê phân tích dữ liệu, được dùng trong nhiều lĩnh vực, bao gồm nhận dạng mẫu, phân tích ảnh, truy hồi thông tin, tin sinh học, nén dữ liệu, đồ họa máy tínhhọc máy.

Phân tích cụm có nguồn gốc ở lĩnh vực nhân chủng học do Driver và Kroeber đề xuất năm 1932[3] và giới thiệu trong tâm lý học bởi Joseph Zubin năm 1938[4] và Robert Tryon năm 1939[5] cũng như được dùng khá nổi tiếng bởi Raymond Cattell bắt đầu từ năm 1943[6] để phân loại lý thuyết tính trạng trong lĩnh vực tâm lý học nhân cách.

Xem thêm

Các dạng phân tích cụm chuyên biệt

  • Automatic clustering algorithms
  • Balanced clustering
  • Clustering high-dimensional data
  • Conceptual clustering
  • Consensus clustering
  • Constrained clustering
  • Community structure
  • Data stream clustering
  • HCS clustering algorithm
  • Sequence clustering
  • Phân vùng quang phổ

Các kỹ thuật được dùng trong phân tích cụm

Tiền xử lý và tham chiếu dữ liệu

Khác

  • Cluster-weighted modeling
  • Curse of dimensionality
  • Determining the number of clusters in a data set
  • Parallel coordinates
  • Phân tích cấu trúc dữ liệu (thống kê)

Tham khảo

  1. ^ What is the Cluster Analysis?, DeepAI.
  2. ^ cluster analysis, Merriam Webster.
  3. ^ Driver and Kroeber (1932). “Quantitative Expression of Cultural Relationships”. University of California Publications in American Archaeology and Ethnology. Quantitative Expression of Cultural Relationships: 211–256. Bản gốc lưu trữ ngày 6 tháng 12 năm 2020. Truy cập ngày 19 tháng 11 năm 2020 – qua http://dpg.lib.berkeley.edu.
  4. ^ Zubin, Joseph (1938). “A technique for measuring like-mindedness”. The Journal of Abnormal and Social Psychology (bằng tiếng Anh). 33 (4): 508–516. doi:10.1037/h0055441. ISSN 0096-851X.
  5. ^ Tryon, Robert C. (1939). Cluster Analysis: Correlation Profile and Orthometric (factor) Analysis for the Isolation of Unities in Mind and Personality. Edwards Brothers.
  6. ^ Cattell, R. B. (1943). “The description of personality: Basic traits resolved into clusters”. Journal of Abnormal and Social Psychology. 38 (4): 476–506. doi:10.1037/h0054116.
  • x
  • t
  • s
  • Outline of statistics
  • List of statistics articles
Continuous probability distribution
Central tendency
Statistical dispersion
Shape of a probability distribution
Count data
  • Index of dispersion
Summary tables
  • Grouped data
  • Frequency distribution
  • Contingency table
Hệ số tương quan
  • Pearson correlation coefficient
  • Rank correlation
    • Spearman's rank correlation coefficient
    • Kendall rank correlation coefficient
  • Partial correlation
  • Scatter plot
Statistical graphics
  • Bar chart
  • Biplot
  • Box plot
  • Control chart
  • Correlogram
  • Fan chart (statistics)
  • Forest plot
  • Histogram
  • Pie chart
  • Q–Q plot
  • Run chart
  • Scatter plot
  • Stem-and-leaf display
  • Radar chart
  • Violin plot
Design of experiments
Survey methodology
  • Sampling (statistics)
    • Stratified sampling
    • Cluster sampling
  • Standard error
  • Opinion poll
  • Questionnaire
Thí nghiệm
  • Scientific control
  • Randomized experiment
  • Randomized controlled trial
  • Random assignment
  • Blocking (statistics)
  • Interaction (statistics)
  • Factorial experiment
Adaptive Designs
  • Adaptive clinical trial
  • Up-and-Down Designs
  • Stochastic approximation
Observational study
  • Cross-sectional study
  • Cohort study
  • Natural experiment
  • Quasi-experiment
Statistical theory
  • Quần thể thống kê
  • Hoạt động thống kê
  • Phân phối xác suất
  • Sampling distribution
    • Order statistic
  • Empirical distribution function
    • Density estimation
  • Mô hình thống kê
    • Statistical model specification
    • Lp space
  • Statistical parameter
    • Location parameter
    • Scale parameter
    • Shape parameter
  • Parametric statistics
    • Likelihood function Monotone likelihood ratio
    • Location–scale family
    • Exponential family
  • Completeness (statistics)
  • Thống kê đủ
  • Plug-in principle
    • Bootstrapping (statistics)
    • U-statistic
    • V-statistic
  • Optimal decision
  • Efficiency (statistics)
  • Statistical distance
    • Divergence (statistics)
  • Asymptotic theory (statistics)
  • Robust statistics
Frequentist inference
Point estimation
  • Estimating equations
  • Bias of an estimators
    • Minimum-variance unbiased estimator
      • Rao–Blackwell theorem
      • Lehmann–Scheffé theorem
    • Median-unbiased estimator
  • Plug-in principle
Interval estimation
  • Khoảng tin cậy
  • Pivotal quantity
  • Likelihood interval
  • Prediction interval
  • Tolerance interval
  • Resampling (statistics)
    • Bootstrapping (statistics)
    • Jackknife resampling
Kiểm định giả thuyết thống kê
  • One- and two-tailed tests
  • Power of a test
    • Uniformly most powerful test
  • Permutation test
    • Resampling (statistics)
  • Multiple comparisons problem
Parametric statistics
  • Likelihood-ratio test
  • Score test
  • Wald test
Specific tests
  • Z-test
  • Student's t-test
  • F-test
Goodness of fit
Rank statistics
  • Sign test
    • Sample median
  • Wilcoxon signed-rank test
    • Hodges–Lehmann estimator
  • Mann–Whitney U test
  • Nonparametric statistics Analysis of variance
    • Kruskal–Wallis one-way analysis of variance
    • Friedman test
    • Jonckheere's trend test
Suy luận Bayes
Hệ số tương quan
  • Pearson correlation coefficient
  • Partial correlation
  • Confounding
  • Coefficient of determination
Phân tích hồi quy
  • Errors and residuals
  • Regression validation
  • Mixed model
  • Simultaneous equations models
  • Multivariate adaptive regression spline
Hồi quy tuyến tính
  • Simple linear regression
  • Ordinary least squares
  • General linear model
  • Bayesian linear regression
Non-standard predictors
Generalized linear model
  • Exponential family
  • Logistic regression / Binomial regression / Poisson regressions
Partition of sums of squares
  • Analysis of variance
  • Analysis of covariance
  • Multivariate analysis of variance
  • Degrees of freedom (statistics)
Categorical variable / Multivariate statistics / Chuỗi thời gian / Survival analysis
Categorical variable
Multivariate statistics
Chuỗi thời gian
General
  • Decomposition of time series
  • Linear trend estimation
  • Stationary process
  • Seasonal adjustment
  • Exponential smoothing
  • Cointegration
  • Structural break
  • Granger causality
Specific tests
Time domain
  • Autocorrelation
    • Partial autocorrelation function
  • Cross-correlation
  • Arma
  • Box–Jenkins method
  • ARCH
  • Vector autoregression
Frequency domain
Survival analysis
Survival function
  • Kaplan–Meier estimator
  • Proportional hazards models
  • Accelerated failure time model
  • First-hitting-time model
Failure rate
  • Nelson–Aalen estimator
Test
  • Logrank test
List of fields of application of statistics
Biostatistics
Engineering statistics
  • Chemometrics
  • Methods engineering
  • Probabilistic design
  • Statistical process control / Kiểm soát chất lượng
  • Reliability engineering
  • System identification
Social statistics
Spatial analysis
  • Thể loại[[::Thể loại:Thống kê]]
  • '
  • Trang CommonsCommons:Category:Statistics
  • Dự án Wiki Wikipedia:WikiProject Statistics
  • x
  • t
  • s
Điện toán khả vi
Chung
  • Lập trình khả vi
  • Neural Turing machine
  • Differentiable neural computer
  • Automatic differentiation
  • Neuromorphic engineering
Khái niệm
Ngôn ngữ lập trình
  • Python (ngôn ngữ lập trình)
  • Julia (programming language)
Ứng dụng
Phần cứng
  • Tensor Processing Unit
  • Vision processing unit
  • Memristor
  • SpiNNaker
Thư viện phần mềm
Thực thi
Nghe-nhìn
Lời nói
Quyết định
  • AlphaGo
  • Q-learning (học tăng cường)
  • State–action–reward–state–action
  • OpenAI Five
Nhân vật
  • Alex Graves (computer scientist)
  • Ian Goodfellow
  • Yoshua Bengio
  • Geoffrey Hinton
  • Yann LeCun
  • Andrew Ng
  • Demis Hassabis
  • David Silver (computer scientist)
  • Cổng thông tin Cổng
    • Portal:Lập trình máy tính
    • Cổng thông tin:Công nghệ
  • Thể loại Category
    • [[::Thể loại:Mạng thần kinh nhân tạo]]
    • [[::Thể loại:Học máy]]
Bài viết này vẫn còn sơ khai. Bạn có thể giúp Wikipedia mở rộng nội dung để bài được hoàn chỉnh hơn.
  • x
  • t
  • s