VBM684 Data Mining

( VBM684 Veri Madenciliği )

 


Dönem

2024 Bahar

Öğretim Üyesi

Prof. Dr. İlyas Çiçekli

Email:  ilyas@cs.hacettepe.edu.tr

Ders Saati 

Perşembe 18:30-21:00

Sınıf : D10

 


Ders Kitabı

·       Pang-Ning Tan, Michael Steinbach and Vipin Kumar, Introduction to Data Mining, 3rd Edition, Pearson, 2014.

·       Jiawei Han, Micheline Kamber and Jian Pei, Data Mining Concepts and Techniques, 3rd Edition, Morgan Kaufmann, 2012.

Diğer Kaynaklar

·       Ian H. Witten, Eibe Frank, Mark A. Hall and Christopher J. Pal, Data Mining: Practical Machine Learning Tools and Techniques, 4th  Edition, Morgan, Kaufmann, 2017.

·       T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2nd Edition, Springer, 2017.

·       Anand Rajaraman & Jeffrey D. Ullman, Mining of Massive Datasets, 2011

·       B. Liu, Web Data Mining, Springer 2006.

 


Notlandırma

Ödev                     : 50%

Final Sınavı          : 50%  

 


Ders İçeriği (Revize edilebilir)

Konu

Kitap Bölümü

Introduction to Data Mining

Ch. 1

Data Preprocessing – Types of Data, Data Preparation

Ch. 2

Data Preprocessing

Han: Ch. 3

Data Warehouses, OLAP

Han: Ch. 4

Classification – Basic Concepts, Decision Trees

Ch. 4

Classification – Rule Based Classifiers, Bayesian Classifiers

Ch. 4

Classification – Model Evaluation

Ch. 5

Classification – Nearest-Neighbor Classifiers, Artificial Neural Networks

Ch. 5

Association Analysis – Mining Frequent Patterns, Associations, and Correlations

Ch. 6

Association Analysis – Advanced Pattern Mining

Ch. 7

Cluster Analysis: K-Means and Hierarchical Clustering

Ch. 8

Cluster Analysis: Additional Issues and Algorithms

Ch. 9

Anomaly Detection

Ch. 10

Data Mining Trends and Applications

 


 

Ders Notları:

·       lec01-IntroductionToDataMining.pdf

·       lec02-DataAndDataTypes.pdf

·       lec03-DataPreprocessing.pdf

·       lec04-DataWareHouseAndOLAP.pdf

·       lec05_Classification_DecisionTree.pdf

·       lec06_Classification_NaiveBayes_RuleBased.pdf

·       lec07_Classification_ModelEvaluation_Ensemble.pdf

·       lec08_Classification_kNN_ANN.pdf

·       lec09_AssociationRuleMining.pdf

·       lec10_Clustering.pdf

 


 

Yazılım:

·     Bu ders için gerekli yazılımlar (Weka ve R/RStudio) açık kaynaktır ve GNU Genel Kamu Lisansı altında ücretsiz olarak mevcuttur.

·     Sisteminize bağlı olarak Weka'nın en son kararlı sürümü olan Weka 3.8'i aşağıdaki adresten indirip yükleyebilirsiniz: http://www.cs.waikato.ac.nz/ml/weka/downloading.html .

·     R ve RStudio'nun (R için IDE) en son sürümleri https://cran.rstudio.com/  ve https://www.rstudio.com/products/rstudio/download/  adreslerinde mevcuttur.

 

 

 

 

 

Duyurular:

·     Tüm ders duyuruları (not ve ödev duyuruları) ve ödev teslimleri için HADI sistemi (https://hadi.hacettepe.edu.tr/) kullanılacaktır.

·     İlk iki hafta gerekli olan yazılımları bilgisayarınıza indirin ve kullanmasını öğrenin.

·     İlk ödeviniz bir kısmı R programlaması ile ilgili olacak.

·     İkinci ödevinizde Weka yazılımını kullanacaksınız.