PER-PROTOKOL VE İNTENT-TO TREAT ANALİZ

Biyoistatistik çalışmaya katılan deneklerin tamamını çeşitli nedenlerden dolayı çalışma sonuna kadar taşıyamayabiliriz. Çalışma protokolü ihlali, çeşitli advers-ciddi advers olaylar, deneğin tedaviden memnuniyetsizlik nedeniyle çıkması ya da kontrol zamanlarına gelmemesi veya denekten bilgi alınamaması bu sebeplerden bazılarıdır. Denekler eksik gözlem sebebi ile çalışmaya alınmazlarsa belki de araştırılan etkene ait sorun değerlendirme dışı bırakılmış olabilir.  Örnek verecek olursak X ilacı alan 100 hastadan 80 tanesi çalışmayı tamamlamış ve 60 tanesinde olumlu gözlemde bulunmuştur. Y ilacı alan 80 hastadan 30 tanesi çalışmayı tamamlamış ve 25 tanesinde olumlu gözlem izlenmiştir. Sonuç olarak, çalışmayı tamamlayamayanlar analiz dışı bırakılırsa X ilacı grubunda başarı oranı 60/80 (%75), B ilacı grubunda ise 25/30 (%83) olur. Yani Y ilacı X ilacından tedavide etkinlik yönünden daha iyidir diyebiliriz. Bu tip analize per-protokol analiz (protokole göre analiz) denir. Ama gerçek yaşamda, ilacı çeşitli yan etki nedenleri ile bırakanların çok olması ilacın başarısızlığını gösterir. Bu nedenle aslında X grubunda başarı 60/100 yani %60, Y grubunda ise 25/80 yani %31’dir. Yani A ilacı tedavide etkinlik açısından B ilacından daha iyidir. Bu tip analize intent-to treat analiz (tedavi amacına yönelik analiz) denir. Bu tip çalışmaların sonuçları verilirken analizin nasıl yapıldığı belirtilmelidir. Doğaldır ki, bir çalışmadan ayrılan ya da izlemden kaybolan hasta sayısının beklenenden çok olması o çalışmanın yürütülmesinde bir sorun olduğunun göstergesidir.

Buna benzer çalışmaların sonuçları verilirken istatistik analizin hangi yöntemle yapıldığı belirtilmelidir. CONSORT bildirisine göre denek alım kriterinin çalışma başında tanımlanmış olması, bu kritere uymayan tüm deneklerin çalışma dışı bırakılmış olması ve bu kritere uyumsuzluğu gösterecek somut ölçüm yöntemlerinin belirli olması gerekmektedir.

CONSORT bildirisi, bilimsel çalışmaların tasarım, yürütme, analiz ve yorum aşamalarının okur tarafından tümü ile anlaşılabilmesi için gerekli olan yöntemlerini içerir.

İSTATİSTİKSEL GÜCÜ ETKİLEYEN FAKTÖRLER VE ÖRNEKLEM BÜYÜKLÜĞÜ

1.      İstatistiksel Güç (1-β): Yukarıda açıklanan istatistiksel güç düzeyi çalışmanın başında belirlenmelidir ve genellikle %80’in altında olmamalıdır. Yapılan çalışmanın istatistiksel gücünü çalışmanın sonunda da belirleyebiliriz. Ancak bu durumda belirlenen güç yeterli düzeyde değilse yapacak fazla bir şeyimiz kalmaz.

2.      İstatistiksel Anlamlılık Düzeyi ve 1. Tip Hata (α): İstatistiksel anlamlılık düzeyi, gerçekte var olmayan bir farklılığın ya da ilişkinin yapılan istatistiksel analizlerle de aynı şekilde farksız ya da ilişkisiz bulunması olasılığıdır. Eğer gerçekte farksız iki grup arasında, yapılan analizler sonucunda şansa bağlı olarak bir fark bulmuşsak o zaman 1. tip hata yapmışız demektir. Yapılan çalışmalarda genellikle en az %95 güven düzeyi (ya da %5 yanılma payı da denebilir) kullanılır. Örneklem büyüklümüz sabitken eğer anlamlılık düzeyini arttırırsak (örneğin %95 güven düzeyinden %99 güven düzeyine çıkarsak) istatistiksel güç azalır. Çünkü var olan bir farklılığı daha katı bir anlamlılık düzeyinde bulmamız zorlaşır. Daha yüksek bir anlamlılık düzeyi için yeterli istatistiksel gücü sağlayabilmek için örneklem büyüklüğünü arttırmalıyız.

3.      İstatistiksel Anlamlılık Düzeyinin Tek veya Çift Yönlü Olması: İstatistiksel olarak bir ilişki ya da farklılığın incelendiği durumlarda kurulan hipotezler tek ya da çift yönlü olabilmektedir. Örneğin iki grup arasında belli bir değer açısından karşılaştırma yapıyor olalım. Seçenek hipotezimizde birinci grubun incelenen değer açısından ikinci gruptan farklı olduğunu söylüyorsak hipotezimizi iki yönlü kurmuş oluruz. Çünkü birinci grubun mu ikinci gruptan büyük olduğunu, yoksa ikincinin mi birinciden büyük olduğunu belirtmemişiz. Bu durumda olasılıksal olarak her iki durumu da göz önüne almalıyız. Her iki durumu da göz önüne aldığımız için hipotezimizi iki yönlü kurmuş oluyoruz. Eğer seçenek hipotezimizde birinci grubun incelenen değer açısından ikinci gruptan büyük olduğunu söylüyorsak hipotezimizi tek yönlü kurmuş oluruz. Çünkü sadece büyük olduğu durumdan bahsediyoruz.

Genellikle çalışmalarda iki yönlü hipotez testleri kullanılmaktadır. Ancak tek yönlü hipotez testlerinin de kullanıldığı çalışmalar vardır. Aynı koşullar altında tek yönlü yapılan bir istatistiksel analizin gücü, çift yönlü yapılana göre daha fazladır.

4.      Etki Büyüklüğü: Etki büyüklüğü, istatistiksel olarak bir farklılığın ya da ilişkinin incelendiği durumda, bu farkın ya da ilişkinin en az hangi değeri aldığı durumda  teorik ya da istatistiksel olarak anlamlı olduğudur. Çalışmalarda etki büyüklüğü yükseldikçe uygulanan istatistiksel analizin bu etkiyi bulması olasılığı daha yüksek olacağından istatistiksel güç de artar. Aksine etki büyüklüğü düşük olan bir çalışmada yapılan analizin bu etkiyi ortaya çıkarma olasılığı daha düşük olduğundan gücü de daha düşüktür. Düşük etki büyüklüğünü ortaya çıkarabilme olasılığını (istatistiksel gücü) artırmak için aynı koşullarda örneklem büyüklüğü arttırılmalıdır.

5.      Bağımlı Değişkenin Değişkenliği: Bağımlı değişkenin değişkenliğinin ya da varyansının daha yüksek olduğu çalışmalarda tip 2 hata yapma olasılığı artar ve istatistiksel güç azalır.

6.      Örneklem Büyüklüğü: Güç analizinin temel amacı yukarıda bahsedilen 5 faktörün gerekliliklerine cevap verebilecek en küçük örneklem büyüklüğünün hesaplanmasıdır. Örneklem büyüklüğü arttıkça tüm kitleye ilişkin parametre tahminleri de daha kesin olmaya başlar, standart hata azalır ve yapılan istatistiksel analizlerin de gücü artar.

Tüm bu açıklanan faktörler değerlendirildiğinde unutulmamalıdır ki uygulanan her analiz farklı bir güç hesabı gerektirmektedir.


İSTATİSTİKSEL GÜÇ VE GÜÇ HESABI NEDEN ÖNEMLİDİR?

Geçerliliği ve güvenilirliği yüksek bir çalışma planlamak, çalışma sonucu alınacak kararların geçerliliğini, güvenilirliğini ve duyarlılığını garanti altına almak istatistiksel gücü yüksek çalışmalarla mümkündür. Bu nedenle araştırmacılar çalışmalarını planlamak ve yürütmek için çok fazla çaba harcamakta, zaman ve kaynak ayırmaktadırlar. Yapılan çalışmalar sonucunda elde edilen bulgularda eğer istatistiksel güç yeterli düzeyde değilse çalışma boşa gidebilmekte dolayısıyla o çalışma için harcanan çaba da boşa gidebilmektedir. Ya da çalışmanın gücü ile harcanan zaman ve kaynağın dengesi doğru olmamakta kaynak israfına sebep olunabilmektedir.

İSTATİSTİKSEL GÜÇ NEDİR?

İstatistiksel güç basit olarak gerçekte var olan bir durumun (farklılık ya da ilişki) istatistiksel olarak da anlamlı bulunması olasılığıdır. Bunu daha iyi anlaşılabilmesi için bir örnek üzerinde açıklayalım: Biyoistatistik alanında tıbbi istatistikler gerçekleştiren bir araştırmacının, geliştirilen bir ilacın, hastalığa olan etkisini değerlendirmek istediğini varsayalım. Bu etkiyi istatistiksel olarak değerlendirebilmek için farklı deney düzenleri mevcuttur. Ancak basit düşünürsek; ilaç verilmeden önce hastaların, incelenen hastalığı gösteren verilerine bakılır. İlaç verilir ve sonrasında aynı verilere tekrar bakılır. İlacın hastalık üzerine etkisinin değerlendirilebilmesi için de ilaç verilmeden önceki veriler ile verildikten sonraki veriler gerekli istatistiksel yöntemlerle karşılaştırılır. Eğer gerçek hayatta söz konusu ilaç o hastalık üzerinde etkili ise bizim bu etkiyi çalıştığımız hasta grubu üzerinde uyguladığımız istatistiksel testlerle bulma olasılığımız istatistiksel gücü ortaya koyar. Yani gerçekte var olan bir etkiyi, çalıştığımız örneklem üzerinde yaptığımız istatistiksel testlerle ne derece ortaya koyabiliyorsak çalışmamızın istatistiksel gücü o derece yüksek, koyamıyorsak istatistiksel güç o derece düşüktür. Bu durumu aşağıdaki tablo ile de özetleyebiliriz.

GERÇEK HAYAT

FARK YA DA İLİŞKİ VAR

FARK YA DA İLİŞKİ YOK

YAPILAN ÇALIŞMADA ELDE EDİLEN SONUÇ

FARK YA DA İLİŞKİ BULUNDU

ÇALIŞMA BAŞARILI

ÇALIŞMADA Tip I (α)

HATA YAPILMIŞ

FARK YA DA İLİŞKİ BULUNAMADI

ÇALIŞMADA Tip II (β)

HATA YAPILMIŞ

ÇALIŞMA BAŞARILI

SPSS

SPSS istatistik analizleri için kullanılan bir yazılımdır. Çok geniş bir kitle tarafından kullanılmaktadır. Anket analizi yapanlar, tez analizi yapanlar ya da araştırma projesi yürütenler SPSS yazılımını veri analizi için kullanmaktadır. Genellikle sayısal verilerin analizi için kullanılır.

SPSS ile ki kare analizi, varyans analizi, regresyon analizi, korelasyon analizi, temel bileşenler analizi, faktör analizi, çoklu regresyon analizi, power analizi, ekonometrik analizler gibi çok kullanılan analizlerin yanı sıra çok daha ayrıntılı analizleri yapmak mümkündür. SPSS danışmanlığı ile ayrıntılı bilgi için istatistik danışmanlığı sayfamızı ziyaret edebilirsiniz. SPSS kullanımı ile ilgili ayrıntılı bilgi ve veri analizi uygulamaları görmek için ilgili SPSS videolarımızı izleyebilirsiniz. SPSS kullanımını öğrenmek tez analizi, anket analizi, tıbbi istatistik analizi ve istatistik analiz gibi alanlarda kullanmak için SPSS eğitimlerimize katılabilirsiniz.

İstatistik Danışmanı Seçerken Nelere Dikkat Edilmeli

Araştırma sürecinde bir istatistik danışmanı seçerken aşağıdaki soruları düşünmenizi öneriyoruz.

  • Danışman üst düzey istatistik bilgisine sahip mi?
  • Çalıştığınız alanla ilgili yeterli derecede deneyimi va mı?
  • İstatistik danışmanı bu işi % 100 odaklanarak mı yapıyor, yoksa bu boş zamanlarında yaptıkları bir şey mi ?
  • Çalışmanız tamamlandıktan sonra herhangi bir sorunla karşılaştığınızda karşınızda bir muhatap bulabiliyor musunuz?
  • Çalışma sonucunda elde ettiğiniz çıktı, doğrudan araştırmanızda kullanabileceğiniz bir formatta mı ?

İstatistik Çözümleri

BİLİMSEL BİLGİ BİLİMSEL ARAŞTIRMALARLA ÜRETİLİR. İSTATİSTİKSEL YÖNTEMLERE BİLİMSEL ARAŞTIRMA TAMAMLANDIĞINDA DEĞİL, DAHA PLANLAMA AŞAMASINDA BAŞVURULMALIDIR.

BRADFORD HILL

Hakkımızda

2004 yılında Ankara’da kurulan İstatistik Çözümleri, istatistiğin her alanında Türkiye’nin öncü hizmet sağlayıcısıdır. Projelerinizde sizlere istatistik danışmanlığı ve yüksek kalitede eğitimlerle eşlik ediyoruz. Ayrıca pek çok istatistiksel yazılımı bizim aracılığımız ile temin edebilirsiniz.

II. Dünya Savaşını Nasıl Kazanıldı?

Gavyn Davies’in The Guardian’da 20 Temmuz 2006, Perşembe günü yayınlamış, “Gavyn Davies does the maths – How a statistical formula won the war” makalesinin çevirisidir *:

“Matematiksel çıkarım hakkında sevdiğim bir hikaye anlatacağım. Seviyorum çünkü gerçek olduğu söyleniyor ve II. Dünya Savaşının sonucuna etki etmiştir (her ne kadar küçük olsa da). Bu hikaye, müttefiklerin casusluk şebekesinin başarısız olduğu bir konuda basit bir istatistiksel formülle düşmanın tank üretiminin nasıl tahmin edildiğinin hikayesidir.

1941-42 yıllarında müttefik kuvvetleri ABD ve İngiliz tanklarının Alman Panzer tanklarına kıyasla daha yüksek savaş gücü olduğunu biliyordu ancak müttefiklerin Almanların yeni tasarladıkları IV ve V model tankların yetenekleri konusunda endişeleri vardı. İşin kötüsü düşmanın bir yıl içinde o tanklardan ne kadar üretebileceğini de bilmiyorlardı. Bu bilgi olmadan Avrupa’nın batı cephesi üzerinden işgalinin başarıya ulaşıp ulaşamayacağı konusunda kesin bir fikir sahibi olamazlardı.

Problemi çözmenin bir yolu bu soruyu istihbarat servislerine sormak ve onların da gizlice Alman fabrikalarını gözetlemeleri veya savaş alanındaki tankları saymaları idi. Hem İngilizler hem de Amerikalılar bunu denediler ancak istihbarat birimlerinden gelen rakamlar güvenilir değildi ve çelişkili sonuçlar çıkıyordu. Bu yüzden aynı soruyu istatistik uzmanlarına sormaya ve tank üretim tahminlerinin daha hassas şekilde belirlenip belirlenemeyeceğini görmeye karar verdiler.

İstatistikçilerin elinde bir anahtar bilgi parçası vardı bu da ele geçrilmiş model V tanklarının üzerindeki seri numaralarıydı. İstatistikçiler, Almanların Alman oluşlarından ötürü mantıklı davranıp tankları üretim sırasına göre numaralandırdıklarını düşündüler. Bu çıkarım doğru çıktı. Bu sayede herhangi bir anda Almanların ürettikleri toplam tank sayısına dair matematiksel bir tahminde bulunabileceklerdi.

Temel fikir şuydu: Ele geçirilen tankların üzerindeki en büyük seri numaradan yola çıkarak tüm tank sayısını hesaplamak mümkündür. Alman tankları 1, 2, 3, …, N şeklinde numaralandırılıyordu, N üretilen son tankın seri numarası yani toplam tank sayısı idi. Müttefiklerin beş tank ele geçirdiğini var sayalım ve bunların üzerindeki seri numaralar da sırası ile 20, 31, 43, 78 ve 92 olsun. Bu durumda ellerinde beş elemanlık bir örneklem vardır ve en büyük seri numarası da 92‘dir. Örneklem büyüklüğüne S, en büyük seri numaraya da M diyelim. Çeşitli sayı serileri ile uğraşan istatistikçiler sonunda tank sayısını tahmin etmek için (M-1) x (S+1) / S formülünün yeterince iyi olduğuna karar verdiler. Yukarıdaki örneği ele alırsak bu(92-1) x (5+1) / 5 demektir ve bu da 109.2 sayısına eşitir. Dolayısı ile o esnada üretilen tank sayısı 109 olmalıdır.

Bu formülü kullanan istatistikçiler, Almanların 1940 Haziranı ile 1942 Eylülü arasında ayda 246tank ürettiklerini rapor ettiler. O sırada istihbarat servisi ise aylık tank üretim miktarını 1.400olarak tahmin ediyordu. Savaştan sonra müttefik kuvvetler Alman üretim kayıtlarını ele geçirdiler, söz konusu üç sene boyunca üretilen tank sayısının aylık 245 olduğunu gördüler, yani neredeyse istatistikçilerin tahminlerinin aynısı ve istihbarat servisinin öne sürdüğü tahmininbeşte biri.

Cesaretlenen müttefikler batı cephesinden 1944 yılında saldırıya geçtiler ve Berlin’e giden yolda Panzerlerin hakkından geldiler. Ve işte böylece istatistikçiler savaşı kazandı – kendi tahminelerine göre, her oranda.”

*: Bu yazıyı makine öğrenme yöntemleri ile ilgili güncel linkleri tararken denk geldiğim istatistikçi Rolf Turner‘ın sayfasında fark ettim. Ekonomist Gavyn Davies, 1976 – 1979 yılları arasında İngiltere başbakanının ekonomi ve politika danışmanı olarak çalıştıktan sonra BBC de dahil olmak üzere pek çok kurumda görev almıştır. Davies bir süredir The Guardian gazetesinde bir sütunda yazmaktadır ve makalelerine buradan erişilebilir.