VBM684 Data Mining
( VBM684 Veri Madenciliği )
Dönem |
2025 Bahar |
Öğretim
Üyesi |
Prof. Dr. İlyas Çiçekli Email: ilyas@cs.hacettepe.edu.tr |
Ders
Saati |
Perşembe 18:30-21:00 Sınıf : D9 |
Ders Kitabı
·
Pang-Ning Tan,
Michael Steinbach, Anuj Karpatne and Vipin Kumar, Introduction to Data Mining, 2nd Edition, Pearson, 2019.
·
Jiawei Han, Jian
Pei and Hanghang Tong, Data Mining Concepts and
Techniques, 4th Edition, Morgan Kaufmann, 2019.
Diğer Kaynaklar
· Ian H. Witten, Eibe Frank, Mark A. Hall and Christopher J. Pal, Data Mining: Practical Machine Learning Tools and Techniques, 4th Edition, Morgan, Kaufmann, 2017.
· T. Hastie, R. Tibshirani, and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2nd Edition, Springer, 2017.
· Anand Rajaraman & Jeffrey D. Ullman, Mining of Massive Datasets, 2011
· B. Liu, Web Data Mining, Springer 2006.
Notlandırma
Ödev : 50%
Final Sınavı : 50%
Ders İçeriği (Revize edilebilir)
Konu |
Kitap
Bölümü |
Introduction to
Data Mining |
Ch. 1 |
Data Preprocessing
Types of Data, Data Preparation |
Ch. 2 |
Data Preprocessing |
Han: Ch. 3 |
Data Warehouses,
OLAP |
Han: Ch. 4 |
Classification
Basic Concepts, Decision Trees |
Ch. 4 |
Classification
Rule Based Classifiers, Bayesian Classifiers |
Ch. 4 |
Classification
Model Evaluation |
Ch. 5 |
Classification
Nearest-Neighbor Classifiers, Artificial Neural Networks |
Ch. 5 |
Association
Analysis Mining Frequent Patterns, Associations, and Correlations |
Ch. 6 |
Association
Analysis Advanced Pattern Mining |
Ch. 7 |
Cluster Analysis:
K-Means and Hierarchical Clustering |
Ch. 8 |
Cluster Analysis:
Additional Issues and Algorithms |
Ch. 9 |
Anomaly Detection |
Ch. 10 |
Ders
Notları:
· lec01-IntroductionToDataMining.pdf
· lec04-DataWareHouseAndOLAP.pdf
· lec05_Classification_DecisionTree.pdf
· lec06_Classification_NaiveBayes_RuleBased.pdf
· lec07_Classification_ModelEvaluation_Ensemble.pdf
· lec08_Classification_kNN_ANN.pdf
· lec09_AssociationRuleMining.pdf
Yazılım:
· Bu ders için
gerekli yazılımlar (Weka ve R/RStudio) açık kaynaktır ve GNU Genel Kamu
Lisansı altında ücretsiz olarak mevcuttur.
· Sisteminize
bağlı olarak Weka'nın en son
kararlı sürümü olan Weka 3.8'i
aşağıdaki adresten indirip yükleyebilirsiniz: http://www.cs.waikato.ac.nz/ml/weka/downloading.html
.
· R ve RStudio'nun (R için IDE) en son sürümleri https://cran.rstudio.com/ ve https://www.rstudio.com/products/rstudio/download/ adreslerinde mevcuttur.
Duyurular:
· Tüm ders
duyuruları (not ve ödev duyuruları) ve ödev teslimleri için HADI sistemi (https://hadi.hacettepe.edu.tr/) kullanılacaktır.
· İlk iki
hafta gerekli olan yazılımları bilgisayarınıza indirin
ve kullanmasını öğrenin.
· İlk
ödeviniz bir kısmı R programlaması ile ilgili olacak.
· İkinci
ödevinizde Weka yazılımını
kullanacaksınız.