HIGH DIMENSIONAL DATA Pertemuan 3
PROSES KOLEKSI
DATA
Koleksi data merupakan tahapan
dalam proses penelitianyang penting,
karena hanya dengan mendapatkan
datayang tepat maka proses
penelitian akan berlangsungsampai
peneliti mendapatkan jawaban dari
perumusanmasalah yang sudah
ditetapkan
Sebuah jenis data dalam bidang statistik
yangklasifikasinya berdasarkan sumber dan
pengguna, yangmana data internal ini adalah
data yang bisa didapatkandari dalam maupun
pihak internal pada suatu organisasi,bisa juga
berupa perusahaan atau sebuah tempat dimana
dilakukannya banyak penelitian. Data
internaldigunakan untuk menggambarkan suatu
keadaanmaupun kegiatan dalam suatu organisasi
maupunperusahaan itu sendiri.
DATA INTERNAL
DATA CRAWLING
Analisis data dapat digunakan dalam berb
agai bidang,seperti bisnis, ekonomi, sains,
dan teknologi, danmemainkan peran penting
dalam meningkatkan efisiensidan membuat
keputusan. Selain analisis data, dikenal juga
istilah data crawling.
Data crawling adalah proses automatis
untukmengumpulkan dan mengindeks data
dari berbagaisumber seperti situs web,
database, atau dokumen".
Data yang dikumpulkan melalui crawling
kemudian dapatdiproses dan digunakan
untuk berbagai tujuan, sepertianalisis data,
penelitian, atau pengembangan sistem
informasi.
Tujuan utama data crawling adalah untuk
mengumpulkandata dari berbagai sumber dan
mengindeksnya sehinggamudah untuk diakses dan
dianalisis
TUJUAN DATA
CRAWLING
TUJUAN DATA CRAWLING LANJUTAN
Pengumpulkan data besar dari berbagai sumber sepertisitus web, database, atau
dokumen dalam waktu singkatdan efisien.
Menggunakan data yang dikumpulkan untuk melakukananalisis data seperti analisis
pasar, analisis perilakupelanggan, dan lain-lain
Menggunakan data yang dikumpulkan untuk melakukanpenelitian seperti penelitian
pasar, penelitian sosial, danlain-lain
Membuat database yang mengandung informasi dariberbagai sumber seperti situs
web, database, ataudokumen.
Memantau informasi dari berbagai sumber seperti mediasosial, situs web, dan lain-
lain untuk memastikan bahwainformasi yang diterima akurat dan up-to-date
Menggunakan data yang dikumpulkan untuk membangunaplikasi seperti aplikasi
pencarian, aplikasi e-commerce,dan lain-lain
PEMBAGIAN PERLAKUAN DATA
Pembagian perlakuan terhadap data tergantung jenis data:
1. High Dimensional Data,
2. Network Data,
3. Text Data (Sentiment Analysis)
HIGH DIMENSIONAL DATA
Data dimensi tinggi paling sering digunakan dalampembelajaran mesin, pembelajaran
mendalam, dan ilmudata. Ini mengacu pada kumpulan data yang memilikisejumlah besar
fitur atau variabel, yang dapatmenyulitkan untuk menganalisis dan mengekstraksiwawasan
yang bermakna. Data dimensi tinggi seringditemui di bidang seperti pengenalan gambar
danucapan, pemrosesan bahasa alami, dan genomic
Fungsi dari High-Dimensional Data adalah untukmemberikan informasi yang lebih lengkap
dan detailmengenai suatu objek atau fenomena. Dengan memilikibanyak dimensi, data
dapat memberikan gambaran yanglebih akurat dan kompleks mengenai suatu objek
ataufenomena.
CONTOH HIGH DIMENSIONAL DATA
ontoh High-Dimensional Data adalah data citra medis,data genomik, data sensor,
dan data sosial media. Datacitra medis memiliki banyak dimensi seperti
warna,tekstur, dan bentuk. Data genomik memiliki banyakdimensi seperti urutan DNA
dan ekspresi gen. Datasensor memiliki banyak dimensi seperti suhu,kelembaban, dan
tekanan. Data sosial media memilikibanyak dimensi seperti teks, gambar, dan video
NETWORK DATA
Data network adalah sebuah sistem yang dirancang untukmentransfer dan
menyimpan data dari satu titik akses jaringan ketitik akses jaringan lainnya.
Tak hanya itu, teknologi ini juga bisa transfer data melalui accesspoint yang
diciptakan dari pengalihan data, jalur transmisi, dankontrol sistem.
Data network terdiri dari sistem komunikasi seperti circuit switch,leased line, dan
jaringan packet switching.
JENIS – JENIS NETWORK DATA
Flow Data --> low data bisa dibilang sebagai teknologi terbaikuntuk pemantauan
jaringan umum. Berasal dari sakelar ataurouter, jenis data network ini bisa memberikan
perusanaa akseske berbagai detail tentang protokol, ports, alamat IP, dan lain-lain.
Packet data --> Jenis data network ini merupakan tipe data palingterperinci yang
tersedia untuk tim IT, dan paling sering digunakanuntuk masalah troubleshooting yang
rumit. Meskipun flow datadapat digunakan untuk menyelesaikan sekitar 80%
masalahmasalah jaringan, 20% sisanya memerlukan kinerja dari packetdata
NMP --> Simple network management protocol (SNMP) adalahprotokol lapisan aplikasi
yang digunakan untuk memantau jaringandalam perangkat. Kelebihan jenis data network
ini adalah bahwaia kompatibel dengan hampir semua perangkat teknologi. Tidakseperti
flow data yang dikumpulkan secara otomatis dari routerdan sakelar, SNMP harus secara
teratur melakukan ping ke setiapperangkat untuk pembaruan guna mengumpulkan data
API --> API sendiri adalah seperangkat metode komunikasi yangditentukan di antara
berbagai komponen yang digunakan untukmembangun software. Karena ia berbentuk
antarmuka, tidak adastandar apa pun untuk teknologi ini. Dengan kata lain, API
akanmenjadi unik untuk setiap perangkat, baik dalam bentuk maupunfungsinya
MANFAAT NETWORK DATA
1. Menghemat dana operasional perusahaan.
2. Lisensi situs cenderung menjadi lebih murah daripadamembeli beberapa lisensi
mandiri.
3. File data dapat dengan mudah dibagikan di antarapengguna.
4. Pengguna jaringan dapat berkomunikasi melalui emaildan instant messenger.
5. Keamanan data menjadi lebih terjamin.

pertemuan ke 3 High Dimensional Data.pptx

  • 1.
  • 2.
    PROSES KOLEKSI DATA Koleksi datamerupakan tahapan dalam proses penelitianyang penting, karena hanya dengan mendapatkan datayang tepat maka proses penelitian akan berlangsungsampai peneliti mendapatkan jawaban dari perumusanmasalah yang sudah ditetapkan Sebuah jenis data dalam bidang statistik yangklasifikasinya berdasarkan sumber dan pengguna, yangmana data internal ini adalah data yang bisa didapatkandari dalam maupun pihak internal pada suatu organisasi,bisa juga berupa perusahaan atau sebuah tempat dimana dilakukannya banyak penelitian. Data internaldigunakan untuk menggambarkan suatu keadaanmaupun kegiatan dalam suatu organisasi maupunperusahaan itu sendiri. DATA INTERNAL
  • 3.
    DATA CRAWLING Analisis datadapat digunakan dalam berb agai bidang,seperti bisnis, ekonomi, sains, dan teknologi, danmemainkan peran penting dalam meningkatkan efisiensidan membuat keputusan. Selain analisis data, dikenal juga istilah data crawling. Data crawling adalah proses automatis untukmengumpulkan dan mengindeks data dari berbagaisumber seperti situs web, database, atau dokumen". Data yang dikumpulkan melalui crawling kemudian dapatdiproses dan digunakan untuk berbagai tujuan, sepertianalisis data, penelitian, atau pengembangan sistem informasi. Tujuan utama data crawling adalah untuk mengumpulkandata dari berbagai sumber dan mengindeksnya sehinggamudah untuk diakses dan dianalisis TUJUAN DATA CRAWLING
  • 4.
    TUJUAN DATA CRAWLINGLANJUTAN Pengumpulkan data besar dari berbagai sumber sepertisitus web, database, atau dokumen dalam waktu singkatdan efisien. Menggunakan data yang dikumpulkan untuk melakukananalisis data seperti analisis pasar, analisis perilakupelanggan, dan lain-lain Menggunakan data yang dikumpulkan untuk melakukanpenelitian seperti penelitian pasar, penelitian sosial, danlain-lain Membuat database yang mengandung informasi dariberbagai sumber seperti situs web, database, ataudokumen. Memantau informasi dari berbagai sumber seperti mediasosial, situs web, dan lain- lain untuk memastikan bahwainformasi yang diterima akurat dan up-to-date Menggunakan data yang dikumpulkan untuk membangunaplikasi seperti aplikasi pencarian, aplikasi e-commerce,dan lain-lain
  • 5.
    PEMBAGIAN PERLAKUAN DATA Pembagianperlakuan terhadap data tergantung jenis data: 1. High Dimensional Data, 2. Network Data, 3. Text Data (Sentiment Analysis)
  • 6.
    HIGH DIMENSIONAL DATA Datadimensi tinggi paling sering digunakan dalampembelajaran mesin, pembelajaran mendalam, dan ilmudata. Ini mengacu pada kumpulan data yang memilikisejumlah besar fitur atau variabel, yang dapatmenyulitkan untuk menganalisis dan mengekstraksiwawasan yang bermakna. Data dimensi tinggi seringditemui di bidang seperti pengenalan gambar danucapan, pemrosesan bahasa alami, dan genomic Fungsi dari High-Dimensional Data adalah untukmemberikan informasi yang lebih lengkap dan detailmengenai suatu objek atau fenomena. Dengan memilikibanyak dimensi, data dapat memberikan gambaran yanglebih akurat dan kompleks mengenai suatu objek ataufenomena.
  • 7.
    CONTOH HIGH DIMENSIONALDATA ontoh High-Dimensional Data adalah data citra medis,data genomik, data sensor, dan data sosial media. Datacitra medis memiliki banyak dimensi seperti warna,tekstur, dan bentuk. Data genomik memiliki banyakdimensi seperti urutan DNA dan ekspresi gen. Datasensor memiliki banyak dimensi seperti suhu,kelembaban, dan tekanan. Data sosial media memilikibanyak dimensi seperti teks, gambar, dan video
  • 8.
    NETWORK DATA Data networkadalah sebuah sistem yang dirancang untukmentransfer dan menyimpan data dari satu titik akses jaringan ketitik akses jaringan lainnya. Tak hanya itu, teknologi ini juga bisa transfer data melalui accesspoint yang diciptakan dari pengalihan data, jalur transmisi, dankontrol sistem. Data network terdiri dari sistem komunikasi seperti circuit switch,leased line, dan jaringan packet switching.
  • 9.
    JENIS – JENISNETWORK DATA Flow Data --> low data bisa dibilang sebagai teknologi terbaikuntuk pemantauan jaringan umum. Berasal dari sakelar ataurouter, jenis data network ini bisa memberikan perusanaa akseske berbagai detail tentang protokol, ports, alamat IP, dan lain-lain. Packet data --> Jenis data network ini merupakan tipe data palingterperinci yang tersedia untuk tim IT, dan paling sering digunakanuntuk masalah troubleshooting yang rumit. Meskipun flow datadapat digunakan untuk menyelesaikan sekitar 80% masalahmasalah jaringan, 20% sisanya memerlukan kinerja dari packetdata NMP --> Simple network management protocol (SNMP) adalahprotokol lapisan aplikasi yang digunakan untuk memantau jaringandalam perangkat. Kelebihan jenis data network ini adalah bahwaia kompatibel dengan hampir semua perangkat teknologi. Tidakseperti flow data yang dikumpulkan secara otomatis dari routerdan sakelar, SNMP harus secara teratur melakukan ping ke setiapperangkat untuk pembaruan guna mengumpulkan data API --> API sendiri adalah seperangkat metode komunikasi yangditentukan di antara berbagai komponen yang digunakan untukmembangun software. Karena ia berbentuk antarmuka, tidak adastandar apa pun untuk teknologi ini. Dengan kata lain, API akanmenjadi unik untuk setiap perangkat, baik dalam bentuk maupunfungsinya
  • 10.
    MANFAAT NETWORK DATA 1.Menghemat dana operasional perusahaan. 2. Lisensi situs cenderung menjadi lebih murah daripadamembeli beberapa lisensi mandiri. 3. File data dapat dengan mudah dibagikan di antarapengguna. 4. Pengguna jaringan dapat berkomunikasi melalui emaildan instant messenger. 5. Keamanan data menjadi lebih terjamin.