Diberdayakan oleh Blogger.

QLUCORE OMICS EXPLORER


QLUCORE OMICS EXPLORER

Bab 1

Pendahuluan

1.1 Latar Belakang

1.2 Rumusan Masalah

  1. Memahami bagaimana konsep dasar heatmap
  2. Menambah pengetahuan mengenai heat map
  3. Memahami penggunaan software yang digunakan
  4. Sebagai tugas kelompok mata kuliah softskill

1.3 Tujuan Penulisan

  1. Bagaimana konsep dasar heatmap?
  2. Apa saja yang ada dalam heatmap?
  3. Bagaimana menggunakan aplikasi Qlucore Omics Explorer ?

Bab 2

Landasan Teori

2.1 Definisi Heatmap

Apa itu heatmap? Heatmap adalah sebuah peta yang menggambarkan persebaran lokasi dan frekuensi data dalam dengan pewarnaan. Heatmap adalah representasi grafis dari data di mana nilai-nilai individu yang terkandung dalam matriks yang direpresentasikan sebagai warna. Peta fraktal dan peta pohon baik sering menggunakan sistem serupa warna-coding untuk mewakili nilai-nilai yang diambil oleh variabel dalam hirarki. Istilah ini juga digunakan untuk berarti aplikasi tematik sebagai peta choropleth.

2.2 Sejarah Heatmap

Istilah "Heatmap" pada awalnya diciptakan dan merek dagang oleh software desainer Cormac Kinney pada tahun 1991, untuk menggambarkan tampilan 2D menggambarkan real time informasi pasar keuangan.

2.3 Tipe Heatmap

Ada berbagai jenis heatmap:

2.4 Skema Warna

Ada banyak skema warna yang berbeda yang dapat digunakan untuk menggambarkan heatmap, dengan keuntungan persepsi dan kerugian untuk setiap. Rainbow colormaps sering digunakan, agar manusia dapat merasakan nuansa lebih warna dari yang mereka dapat dari abu-abu, dan ini nantinya akan meningkatkan jumlah detail dipahami dalam gambar. Namun, ini tidak disarankan oleh banyak dalam komunitas ilmiah, dengan alasan sebagai berikut:

  1. Warna kekurangan memesan persepsi alami yang ditemukan dalam grayscale atau hitam colormaps spektrum.
  2. Colormaps umum (seperti "jet" colormap digunakan sebagai default di banyak paket perangkat lunak visualisasi) memiliki perubahan yang tidak terkendali di luminance yang mencegah konversi berarti untuk grayscale untuk tampilan atau pencetakan. Ini juga mengalihkan perhatian dari data aktual, sewenang-wenang membuat daerah kuning dan cyan tampil lebih menonjol dari pada daerah data yang sebenarnya paling penting.
  3. Perubahan antara warna juga menyebabkan persepsi gradien yang tidak benar-benar hadir, membuat gradien yang sebenarnya kurang menonjol, yang berarti bahwa colormaps pelangi dapat rinci sebenarnya jelas dalam banyak kasus daripada meningkatkan itu.

2.5 Cluster Heatmap

Cluster Heatmap atau Peta klaster panas adalah kotak atau persegi panjang dari matriks data dengan pohon klaster ditambahkan ke margin-nya. Dalam area tampilan yang relatif kompak, memfasilitasi pemeriksaan baris, kolom, dan struktur cluster bersama. Matriks data yang cukup besar (beberapa ribu baris / kolom) dapat ditampilkan secara efektif pada warna monitor resolusi tinggi dan matriks yang lebih besar dapat ditangani di media cetak atau di display megapiksel.
Peta klaster panas terkenal dalam ilmu alam dan salah satu grafik yang paling banyak digunakan dalam ilmu biologi. Sebagai Weinstein (2008) menyebutkan:
Weinstein menggambarkan peta panas sebagai berikut:
Gambar 1 menunjukkan peta panas khas seperti yang dijelaskan oleh Weinstein. Yang paling populer bioinformatika perangkat lunak untuk memproduksi grafis ini didokumentasikan dalam Eisen et al. (1998). The Eisen kertas, yang menggambarkan sebuah cluster panas peta Program, adalah artikel yang paling dikutip ketiga di PNAS pada tanggal 1 Juli, 2008 (PNAS 2008). The "Debut" Weinstein mengacu mungkin adalah debut dalam literatur biologi, tapi jelas tidak debut dalam literatur statistik. Komponen layar ini memiliki sejarah panjang dalam grafik statistik. Itu referensi biologi memberikan sedikit indikasi latar belakang untuk ide-ide yang mendasari diperlukan untuk membangun peta panas. Pada artikel ini, kita menelusuri garis keturunan dari peta panas dan menunjukkan apa elemen yang akhirnya terintegrasi dalam tampilan yang ahli biologi akhirnya diadopsi.
Untuk menjelaskan sejarah layar ini, kami akan menyajikan masing-masing komponen yang mendasari desain peta klaster panas. Beberapa yang cukup lama, beberapa yang relatif baru.

2.5.1 Shading Matriks

2.5.2 Permuting Matriks

Seriation
selama lebih dari satu abad pada topik bervariasi disebut seriation atau matriks penataan kembali (Robinson 1951; Kendall 1963; McCormick et al. 1972; Hubert 1974, 1976; Lenstra 1974; Ramah 2002; Ramah dan Kwan 2003; Climer dan Zhang 2006). Sepuluh tahun setelah Petrie, Jan Czekanowski mengembangkan metode seriation dan menggunakan Dialog berbayang gram untuk mewakili struktur data blok-diagonal. Gambar 5 menunjukkan matriks diurutkan data pendidikan dari Czekanowski (1909). Display Czekanowski, kecuali kurangnya pewarnaan dan pohon klaster ditambahkan, adalah mirip dengan output dari program penataan kembali matriks komputer kontemporer (Liiv 2008)
Guttman Scalogram
Clustering hirarkis
Dua arah Clustering
Kerja Hartigan ini, Wilkinson (1984) menerapkan dua arah pengelompokan hirarki rutin pada persegi panjang matriks data, menggunakan metode shading Ling untuk layar.
Seriating a Binary Tree
Appending Trees
Weinstein (2008) menemukan membangun klaster panas memetakan sebuah "proses mengejutkan halus." Deskripsinya kehalusan ini tidak akan mengejutkan ahli statistik. Mereka yang akrab dengan literatur klaster tahu bahwa ada literatur.
Isu-isu mengenai pilihan ukuran jarak (Euclidean, tertimbang Euclidean, City Block, dll) dan pilihan metode linkage (tunggal, lengkap, rata-rata, pusat massa, Ward, dll). Kettenring (2006) membahas masalah ini dalam praktek. Selain itu, Weinstein menyebutkan masalah memesan daun clustering pohon, menunjukkan bahwa "beberapa tujuan (tapi, untuk gelar, sewenang-wenang) aturan harus dipanggil untuk memutuskan mana cara masing-masing cabang akan, pada kenyataannya, ayunan "Seperti yang telah kami sebutkan, ini bukan tujuan yang sewenang-wenang.; itu a-didefinisikan dengan baik masalah seriation. Paket statistik modern menerapkan tampilan peta panas sebagai bagian dari paket pengelompokan (misalnya, JMP dan SYSTAT) atau mereka membuatnya mudah untuk merencanakan peta panas menggunakan algoritma seriation (misalnya, R dan Stata).
Dengan demikian, semua pilihan yang tersedia untuk pengelompokan atau analisis lainnya renderable di peta panas. Ini arsitektur fleksibel menggarisbawahi fakta bahwa peta panas adalah refleksi visual model statistik. ini bukan pemesanan sewenang-wenang baris dan kolom klaster pohon. Secara umum, peta matriks panas dapat dianggap sebagai display yang baris dan kolom telah permutasi melalui algoritma. Banyak referensi baru-baru ini dikutip dalam artikel ini menyebutkan eksplisit fungsi tujuan untuk mengevaluasi permutasi yang dihasilkan. Fungsi kerugian seriation populer adalah jumlah dari jarak antara baris dan kolom yang berdekatan. Kita dapat meminimalkan fungsi ini langsung pada dataset yang diberikan atau menggunakannya untuk mengevaluasi kebaikan dari seriation heuristik tertentu. Atau, kita dapat mencicipi nilai dari distribusi bivariat diketahui, mengacak baris dan kolom dalam matriks data sampel, dan membandingkan solusi dari algoritma seriation berbeda.
Wilkinson (2005) yang dihasilkan matriks persegi panjang yang baris dan kolom covariances ditentukan oleh lima berbeda struktur kovarians: Toeplitz, Band, Edaran, Equicovariance, dan Blok diagonal. Dia kemudian secara acak baris dan kolom permutasi sebelum menerapkan beberapa algoritma seriation yang berbeda, termasuk clustering, MDS, dan SVD. Secara keseluruhan, SVD pulih pemesanan asli lebih baik daripada metode lain yang digunakan pada semua lima jenis matriks. Temuan ini menunjukkan bahwa SVD sederhana mungkin yang terbaik metode seriation umum dan klaster yang metode harus dibatasi kepada mereka dataset mana model cluster yang sesuai. Jika SVD yang dipilih, maka salah satu harus mempertimbangkan metode yang kuat terakhir untuk dekomposisi ini (Liu et al. 2003). Untuk data microarray, itu masih merupakan pertanyaan terbuka apakah seriation berbasis hirarkis-clustering lebih berguna daripada pendekatan lain, meskipun popularitas dari metode ini.

Bab 3

Aplikasi pendukung Heatmap

3.1 Qlucore Omics Explorer

3.1.1 Apa itu Qlucore Omics Explorer?

Perangkat lunak Qlucore omics Explorer dapat digunakan untuk menganalisis data set seperti:

3.1.2 Tutorial menggunakan Qlucore Omics Explorer (QOE)

Untuk memulai, kita pertama-tama mengembalikan pengaturan default.
Untuk membuka file data.
The Qlucore Test Data Set sekarang terbuka di QOE dan Anda memiliki posisi awal untuk mulai menganalisis data.
Ada beberapa jenis plot yang berbeda tersedia di QOE dan adalah mungkin untuk mengkonfigurasi plot dalam berbagai cara. Ada delapan jenis plot utama dan Anda memilih jenis petak di Metode tab.
QOE memungkinkan tingkat fleksibilitas yang tinggi dalam jumlah plot dan dataset yang Anda bisa buka secara paralel. Ketika banyak plot terbuka plot yang terakhir diaktifkan oleh kiri klik dengan Mouse disebut plot aktif. Operasi yang dipilih biasanya akan mempengaruhi plot aktif.
Statistik jendela yang penting dan Anda memiliki kebebasan untuk posisi jendela ini dimanapun Anda inginkan di layar Anda. Kami kemudian akan menjelaskan beberapa fungsi jendela Statistik
Clear dan Multi dua kontrol yang mempengaruhi penggunaan alat mouse yang dipilih. Yang jelas akan menghapus semua tanda dan label yang dipilih dan Multi akan memungkinkan Anda untuk membuat beberapa Pilihan.
Di sudut kiri bawah dari jendela utama Anda menemukan Status Bar. Di sini Anda melihat teks 12/12 Sampel, menunjukkan bahwa semua sampel yang tersedia saat ini dipertimbangkan dalam alur kerja, masing-masing dari mereka sesuai dengan salah satu dari 12 bulatan kecil yang Anda lihat diplot di layar.

3.1.3 Analisis statistik dengan Visual Feedback

Pada bagian ini kita akan terus bekerja dengan hanya satu petak aktif dan itu akan menjadi heatmap.

3.1.4 Menggunakan Jaringan dan Grafik

3.1.5 Modifying annotations

Plot di bawah ini adalah dari tengah proses reklasifikasi. Beberapa sampel tidak dijelaskan dalam kelompok baru (= biru muda) dan beberapa masih putih.

3.1.6 Multiple Plot Windows

3.1.7 Mengerjakan dengan Variabel

Ada sejumlah cara untuk variabel warna (Solid, varians, R2, ...) melihat daftar pilihan Color Variabel untuk semua pilihan.

3.1.8 Membuat Penggolongan

Cara alternatif, untuk uji statistik, untuk mengidentifikasi variabel (fitur) dari bunga acuan misalnya ketika tujuannya adalah untuk melakukan penemuan biomarker, adalah untuk menciptakan classifier dan mengamati variabel yang yang dipilih. Daftar ini variabel adalah titik awal yang baik untuk memahami variabel yang yang terbaik potensial biomarker.

3.1.9 Analisis lebih lanjut dan eksplorasi

Pada titik ini dalam analisis kita telah membahas berbagai fungsi dan Anda memiliki membiasakan diri dengan metode seleksi, pilihan pewarna, plot disinkronkan dan banyak lagi. Pada bagian berikut kita akan lebih singkat menyoroti fungsi tambahan. Kita mulai dengan plot Box.
Box plot
Bar plot
Bar Plot dapat dikonfigurasi dalam beberapa cara dan juga mendukung operasi pada kelompok (seperti rata-rata)
Line plots and Kaplan Meier survival plot
Scatter plots
Contoh kedua adalah Variabel Scatter Plot.

3.1.10 Mengekspor gambar, animasi dan data lainnya

Bab 4

Kasus pemanfaatan pada Qlucore Omics Explorer

4.1 Uji Hipotesis

4.1.1 Apa itu Hipotesis?

4.1.2 Apa itu nilai P?

4.1.3 Apa itu nilai Q?

Interpretasi alternatif, cocok untuk situasi di mana beberapa tes dilakukan, diberikan oleh tingkat penemuan palsu (FDR). FDR adalah fraksi yang diharapkan dari penemuan palsu di antara semua hasil tes signifikan. HaInterpretasi alternatif, cocok untuk situasi di mana beberapa tes dilakukan, diberikan oleh tingkat penemuan palsu (FDR). FDR adalah fraksi yang diharapkan dari penemuan palsu di antara semua hasil tes signifikan. Hal ini dimungkinkan untuk menghitung dikoreksi Nilai P, atau Nilai Q, untuk masing-masing variabel. Nilai Q adalah analog FDR dari Nilai P konvensional. Untuk variabel tertentu (misalnya, dengan p-value p *), Nilai Q memperkirakan fraksi penemuan palsu di antara semua variabel dengan Nilai P di bawah p *. Perhatikan bahwa Nilai Q tidak memberikan probabilitas bahwa variabel sebenarnya adalah positif palsu. Oleh karena itu, ia tidak memberitahu Anda yang variabel yang paling mungkin penemuan palsu. Untuk mendapatkan perasaan untuk tarif penemuan palsu, bayangkan mengambil semua Nilai P yang dihitung dan lapisan mereka, memerintahkan dalam urutan yang meningkat. Menetapkan cutoff signifikansi sekarang berarti untuk memutuskan ambang (misalnya Nilai P 0,05), dan mempertimbangkan semua nilai p di bawah ambang batas yang mewakili "penemuan". Tingkat penemuan palsu adalah fraksi yang diharapkan dari penemuan palsu di antara ini, yaitu, fraksi penemuan yang hipotesis nol benar-benar benar (ingat bahwa hipotesis nol didefinisikan dalam hal parameter populasi). Sebuah penemuan palsu demikian variabel yang memperoleh pvalue rendah hanya kebetulan acak, tanpa sinyal mendasari benar dalam populasi. Salah satu cara untuk mengurangi jumlah penemuan palsu akan mendorong cutoff signifikansi lebih dekat ke nol. Namun, sejak penemuan palsu dicampur dengan penemuan yang benar (yang untuk yang ada benar-benar berpengaruh pada tingkat populasi), ini akan mengecualikan banyak penemuan yang benar. Dengan kata lain, kita sering perlu untuk memungkinkan beberapa penemuan berpotensi palsu untuk mendapatkan orang-orang yang benar. Nilai Q dihitung dengan Qlucore omics Explorer dapat digunakan dalam cara yang berbeda. Satu pendekatan adalah untuk memutuskan mana yang diharapkan sebagian kecil dari penemuan palsu yang satu bersedia menerima dan kemudian menetapkan ambang batas Nilai Q yang diinginkan, di toolbox Statistik, untuk fraksi ini. Di antara variabel yang tersisa setelah prosedur ini, Anda dapat mengharapkan fraksi penemuan palsu untuk tidak melebihi fraksi ditentukan (perhatikan bahwa mungkin terjadi bahwa tidak ada variabel tetap setelah prosedur ini, jika batas tingkat penemuan palsu yang diinginkan terlalu ketat). Apa tingkat yang dapat diterima dari penemuan palsu tentu saja sangat bergantung pada aplikasi tertentu, tetapi 10% (yaitu ambang nilai Q 0,1) adalah wajar dalam banyak kasus. Pendekatan kedua untuk menggunakan Nilai Q adalah untuk menentukan cutoff signifikansi dengan cara lain (misalnya, berdasarkan Nilai P seperti digambarkan di atas). Nilai Q terbesar di antara variabel yang tersisa kemudian dapat digunakan sebagai perkiraan fraksi penemuan palsu di antara. Perlu diingat bahwa Nilai Q, seperti Nilai P, terkait dengan tes tertentu dan dengan demikian memeriksa bahwa pengaturan di toolbox Statistik setuju dengan tes yang ingin Anda lakukan.

4.1.4 Haruskah saya gunakan uji satu sisi atau dua sisi?

Dalam Statistic Dock Windows Anda mengontrol jenis uji statistik yang ingin Anda siapkan. Tes yang tersedia adalah:
Untuk mengatur tes dan menemukan variabel yang paling terpisah "Placebo" dari "Drug 1" dan "Drug 2", dan memiliki perubahan Fold minimal 1,5, melaksanakan langkah-langkah berikut:
Menggunakan plot kita dapat melakukan beberapa observasi:
Ada banyak cara untuk menyimpan hasil yang diperoleh:

4.1.5 Data set eksplorasi

4.1.6 Apa yang dimaksud dengan t-test dan Kapan saya harus menggunakannya?

Asumsi lain yang mendasari t-test adalah bahwa variabel terdistribusi secara normal di setiap populasi. Namun, untuk ukuran kelompok sampel yang besar (lebih dari, katakanlah, 20-30 pengamatan per kelompok), asumsi ini tidak kritis dan juga untuk kelompok sampel kecil ukuran t-test sering cukup kuat terhadap penyimpangan dari normalitas. Anda dapat memeriksa asumsi normalitas grafis di Qlucore omics Explorer menggunakan kotak plot, yang harus simetris (yaitu, dengan median sekitar di tengah kotak, dengan kumis sekitar sama panjang di setiap sisi). Sayangnya, hal itu bisa sulit untuk mengatakan dari satu set kecil sampel apakah asumsi normalitas puas atau tidak (dan jika kita memiliki banyak sampel, kita melihat bahwa asumsi tidak mungkin yang penting). Kemungkinan lain adalah dengan menggunakan pengalaman sebelumnya, yang mungkin menunjukkan bahwa variabel yang dipertimbangkan kemungkinan akan sekitar terdistribusi normal. Kekokohan t-test juga tergantung pada ukuran kelompok sampel relatif dalam kumpulan data kami dan apakah varians adalah sama antara dua populasi. T-test digunakan oleh Qlucore omics Explorer mengasumsikan varians sama antara populasi. Asumsi ini dapat diperiksa secara grafis menggunakan plot pencar variabel. Jika jumlah sampel pada kedua kelompok adalah sama, t-test ini cukup kuat terhadap pelanggaran asumsi ini. Melihat angka pada bagian ANOVA bawah untuk ilustrasi tentang bagaimana untuk memeriksa asumsi normalitas dan kesetaraan varians grafis, menggunakan alat yang disediakan dalam Qlucore omics Explorer.

4.1.7 Memanfaatkan informasi biologi System (GSEA dan GO)

4.1.8 GO Browser

4.1.9 Apa itu ANOVA dan Kapan saya harus menggunakannya?

4.1.10 Kapan harus menggunakan Penyaringan Varian?

Varians penyaringan dapat digunakan sebagai cara untuk mengurangi jumlah variabel dalam satu set data dalam cara yang tanpa pengawasan (yaitu, tanpa menggunakan penjelasan sampel). Dengan teknik eksperimental saat ini sangat mudah untuk mengumpulkan data untuk sejumlah besar variabel secara bersamaan, dan variabel umumnya tidak secara eksplisit dipilih berdasarkan asumsi sebelumnya dari "interestingness". Oleh karena itu, dapat dibayangkan bahwa sebagian besar variabel menambahkan apa-apa tapi suara untuk analisis dan kami mungkin ingin menghapus variabel ini untuk menjelajahi seluruh data secara lebih rinci. Salah satu cara untuk mengidentifikasi variabel yang berpotensi menarik adalah dengan cara varians mereka. Sebuah variabel yang hampir konstan di semua pengamatan memiliki varians yang rendah, dan kita dapat menghapus variabel seperti dengan cara slider varians dalam Statistik toolbox. Ini juga telah menyarankan bahwa varians penyaringan mungkin berguna untuk meningkatkan kekuatan mendeteksi gen yang diekspresikan secara berbeda dengan t-tes atau ANOVA. Alasan di balik ini adalah bahwa varians penyaringan mengurangi jumlah variabel dan karena itu membuat koreksi untuk beberapa pengujian (lihat pembahasan pada q-nilai di atas) kurang penghambat. Jumlah yang sesuai varians filtering sangat bergantung pada kumpulan data dan tujuan analisis. Jika kumpulan data belum pra-disaring sebelum dimuat ke Qlucore omics Explorer, menyaring lebih dari setengah dari variabel dibayangkan. Jika kumpulan data telah pra-disaring, cukup kurang varians penyaringan mungkin diperlukan.

4.2 PCA plots

4.3 Apa arti penting dari statistik plot PCA.

4.3.1 Bisakah PCA melewatkan struktur dan pola?

Bab 5

Penutup

5.1 Kesimpulan

5.2 Saran

Daftar Pustaka

0 komentar:

Posting Komentar