Khóa Học Online Phân Tích Dữ Liệu Data Analysis Bởi Bis.net.vn | Học Rẻ Hơn Cùng EduMalls | Mã: 9057 Giá gốc là: 1.000.000 ₫.Giá hiện tại là: 149.000 ₫.
Back to products
Lộ Trình Ôn Thi Tốt Nghiệp - Đại Học THPT Quốc Gia 2024 - 2K6 - Full Combo Các Môn Học | Mã: 9002 Giá gốc là: 3.999.000 ₫.Giá hiện tại là: 299.000 ₫.

Khóa Học Online Data Pre-Processing And Analysis: Tiền Xử Lý Và Phân Tích Dữ Liệu | EduMalls | Mã: 9001

Mã: 9001
  • Khóa học cung cấp cho học viên (HV) các kiến thức và kỹ năng cần thiết khi thực hiện việc tiền xử lý và phân tích dữ liệu.
  • Trang bị cho HV những kỹ thuật khai thác dữ liệu, chuyển đổi dữ liệu thô thành dữ liệu có định dạng dễ hiểu.
  • Hướng dẫn HV cách chuẩn bị dữ liệu để phân tích, thực hiện phân tích thống kê, tạo trực quan hóa dữ liệu có ý nghĩa.
  • Cung cấp cho HV các thư viện tiền xử lý và phân tích dữ liệu mạnh mẽ và ưu việt của Python như Numpy, Scipy, Pandas, Matplotlib, Seaborn, pandas profiling, dataprep… Hướng dẫn cách tiền xử lý dữ liệu tiếng Anh, tiếng Việt.
  • Cung cấp cho HV quy trình quản lý phân tích dữ liệu hiệu quả. Hướng dẫn HV sử dụng thư viện mã nguồn mở sklearn để triển khai một số thuật toán Machine Learning giúp xây dựng các mô hình dự đoán thông minh.

[wpsm_button color=”btncolor” size=”medium” link=”https://www.youtube.com/watch?v=rBlLO4w1bCc” icon=”none” class=”” border_radius=”50″ target=”_blank” rel=”nofollow sponsored”]Video Học Thử[/wpsm_button]

Apple Shopping Event

Hurry and get discounts on all Apple devices up to 20%

Sale_coupon_15

Giá gốc là: 5.500.000 ₫.Giá hiện tại là: 159.000 ₫.

20 People watching this product now!
  • Pick up from the Woodmart Store

To pick up today

Free

  • Courier delivery

Our courier will deliver to the specified address

2-3 Days

Free

  • DHL Courier delivery

DHL courier will deliver to the specified address

2-3 Days

Free

  • Warranty 1 year
  • Free 30-Day returns

Payment Methods:

Description

Khóa Học Online Data Pre-Processing And Analysis: Tiền Xử Lý Và Phân Tích Dữ Liệu | EduMalls | Mã: 9001 chia sẻ bởi EduMalls.net cung cấp cho học viên (HV) các kiến thức và kỹ năng cần thiết khi thực hiện việc tiền xử lý và phân tích dữ liệu.

  • Trang bị cho HV những kỹ thuật khai thác dữ liệu, chuyển đổi dữ liệu thô thành dữ liệu có định dạng dễ hiểu. Hướng dẫn HV cách chuẩn bị dữ liệu để phân tích, thực hiện phân tích thống kê, tạo trực quan hóa dữ liệu có ý nghĩa.
  • Cung cấp cho HV các thư viện tiền xử lý và phân tích dữ liệu mạnh mẽ và ưu việt của Python như Numpy, Scipy, Pandas, Matplotlib, Seaborn, pandas profiling, dataprep…
  • Hướng dẫn cách tiền xử lý dữ liệu tiếng Anh, tiếng Việt. Cung cấp cho HV quy trình quản lý phân tích dữ liệu hiệu quả.
  • Hướng dẫn HV sử dụng thư viện mã nguồn mở sklearn để triển khai một số thuật toán Machine Learning giúp xây dựng các mô hình dự đoán thông minh.

[wpsm_woobox id=”3268″]

Khóa học này dành cho ai?

Bạn sẽ nhận được gì qua khóa học?

Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:

  • Hiểu và vận dụng các bước trong quy trình tiền xử lý dữ liệu (Data Pre-processing) khi triển khai dự án Data Science
  • Nắm được quy trình và kỹ thuật phân tích dữ liệu (Data Analysis)
  • Phân tích dữ liệu khám phá (Exploratory Data Analysis – EDA) để có cái nhìn ban đầu về dữ liệu, xác định các yếu tố quan trọng trong bộ dữ liệu
  • Thực hiện các thao tác làm sạch dữ liệu (Data Cleaning)
  • Áp dụng linh hoạt các kỹ thuật chuẩn hóa dữ liệu (Data Standardization) khác nhau tùy vào các bộ dữ liệu và yêu cầu của dự án
  • Tạo các tính năng cần thiết (Feature Engineering)
  • Tiền xử lý dữ liệu tiếng Anh, tiếng Việt
  • Phân tích, triển khai và đánh giá mô hình phân tích dữ liệu
  • Giải thích kết quả từ các phân tích dữ liệu
  • Quy trình quản lý phân tích dữ liệu hiệu quả
  • Sử dụng thư viện mã nguồn mở sklearn để triển khai một số thuật toán Machine Learning
  • Kết hợp trực quan hóa dữ liệu, kết quả thống kê để tạo các báo cáo phân tích dữ liệu mạch lạc, thuyết phục

Thời lượng: 40 giờ – 53 tiết (5 tuần), học trực tiếp trên máy.

Bạn sẽ học những gì?

  • Giới thiệu quy trình phân tích dữ liệu (Data Analysis)
    • ​Business Understanding
    • Data Requirements
    • Data Collection
    • Data Pre-processing
    • Exploratory Data Analysis
    • Modeling & Algorithms
    • Data Product
    • Communication
  • Quy trình tiền xử lý dữ liệu (Data Pre-processing)
    • ​Tích hợp dữ liệu (Data Intergration)
    • Làm sạch dữ liệu (Data Cleaning)
    • Kỹ thuật tạo tính năng (Feature Engineering)
    • Chuyển đổi dữ liệu (Data Transformation)
  • Phân tích dữ liệu khám phá (Exploratory Data Analysis – EDA)
    • ​Xác định các thuộc tính/ biến (Variable Identification)
    • Xử lý dữ liệu trùng (Duplicate values)
    • Xử lý dữ liệu thiếu (Missing values)
    • Xử lý dữ liệu ngoại lệ (Outlier values)
    • Phân tích đơn biến (Univariate Analysis)
    • Phân tích hai biến (Bi-variate Analysis)
    • Các package EDA hữu ích: pandas-profiling, dataprep, ttth-mds5-analyzer
  • Làm sạch dữ liệu (Data Cleaning)
    • Thu dọn dữ liệu (Tidying data)
      • Tidy data: pd.melt()
      • Pivoting data: pivot(), pivot_table()
    • Kết hợp dữ liệu (Combining data)
      • Merge
      • Join
      • Concat
      • Combine
      • Append
      • Nối dữ liệu từ nhiều tập tin
    • Làm sạch dữ liệu (Data Cleaning)
      • Loại bỏ các mẫu trùng
      • Xử lý dữ liệu ngoại lệ
      • Xử lý dữ liệu thiếu
      • Chuyển đổi kiểu dữ liệu phù hợp
      • Làm sạch dữ liệu chuỗi
      • Loại bỏ các mẫu không liên quan
  • Chuẩn hóa dữ liệu (Data Standardization)
    • Log normalization
    • Feauture Scaling
      • Standard scaler
      • MinMax scaler
      • Robust scaler
  • Tạo thuộc tính (Feature Engineering)
    • Mã hóa thuộc tính phân loại (Encoding categorical feature)
      • Integer/ Label Encoder
      • One hot/ Dummy Encoder
    • Xử lý các danh mục không phổ biến (Uncommon category)
      • Binary Encoder
      • Binning
    • Xử lý dữ liệu văn bản (Text)
      • Loại bỏ ký tự không mong muốn
      • Chuẩn hóa loại chữ
      • CountVectorizer
      • TF-IDF
      • N-gram
  • Tiền xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP)
    • Giới thiệu, nhiệm vụ của NLP
    • Các công cụ hỗ trợ NLP thông dụng
    • Kỹ năng làm việc với ngôn ngữ tiếng Anh
    • Kỹ năng làm việc với ngôn ngữ tiếng Việt
  • Xử lý dữ liệu mất cân bằng (Imbalanced Dataset)
    • ​Các chiến thuật làm việc với dữ liệu mất cân bằng
      • Thu thập thêm dữ liệu
      • Thay đổi performance metric
      • Lấy mẫu lại dữ liệu (Resampling Dataset): under-sampling, over-sampling
  • Model deployment (triển khai model) – Linear Regression
    • Linear Regression (Symple Linear Regression, Multiple Linear Regression)
    • Lựa chọn thuộc tính (Feature selection)
      • Tầm quan trọng, lợi ích
      • Xác định/ lựa chọn các feature cần thiết bằng SelectKBest, Correlation matrix & Heatmap
    • Polynomial Regression
    • Pipelines
    • Đa cộng tuyến
  • Logistic Regression
    • ​Giới thiệu, ứng dụng
    • Thuật toán
    • Triển khai & đánh giá model
    • Phát hiện gian lận (Fraud detection).

Khuyến Nghị

Nền tảng cung cấp khóa học rẻ giúp bạn tiết kiệm chi phí và hoàn toàn phù hợp cho người học có khả năng tự học. Nếu bạn có điều kiện hãy mua khóa học gốc để ủng hộ tác giả.

EduMalls.net luôn tuân thủ theo Thông cáo DMCA

Specification

Overview

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

Processor

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

Display

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

RAM

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

Storage

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

Video Card

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

Connectivity

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

Features

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

Battery

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

General

Cấp Độ

Trung Cấp

Ngôn Ngữ

Tiếng Việt

Thể Loại

Khóa Học

Customer Reviews