Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

CubeBox SAYS Dokuman Yonetimi Sistemi

86 views

Published on

İdeal sayısal arşiv yönetim sistemi EBYS DYS nasıl olmalıdır ?

  • Be the first to comment

  • Be the first to like this

CubeBox SAYS Dokuman Yonetimi Sistemi

  1. 1. SAYISAL ARŞİV YÖNETİM SİSTEMİ Hazırlayan Haluk ERYÜKSEL 16 Mart 2015 Secube Mühendislik
  2. 2. Sayısal Arşiv Yönetim Sistemi 16 Mart 2015 Haluk ERYÜKSEL tarafından www.secube.com.tr hazırlanmıştır. 1 SAYISAL ARŞİV YÖNETİM SİSTEMİ Sayısal Arşiv Yönetim Sistemi (SAYS); milyonlarca belgenin kurallara göre insan hatası olmaksızın arşivlenmesi, bu belgeler üzerinden arama yapılabilmesini ve belgelerin imha,arşive kaldırılması zamanlarında olabilecek karmaşanın ortadan kaldırılmasını sağlar. Sayısal Arşiv Yönetim Sistemi ‘nin en önemli özellikleri; milyonlarca belgenin arşivlenmesi ve bunlar üzerinden arama yapılabilmesidir. Bu yüzden indeksleme ve arama motorları SAYS için önemli bir bileşendir. Önemi ise özellikle alt yapının oluşturulmasından ve geleceğe yönelik mimarisinden kaynaklanmaktadır. Çünkü pek çok arşivde belge sayısı oldukça fazladır. Bu yüzden özenli ve düzgün bir mimari olmadığında telafisi oldukça güç olur. Emeklerin ve paranın boşa harcanması bir yana, töhmet altında kalınması ve işin sahiplenilmemesi de beraberinde gelir. Örneğin; karşılaşılan en ciddi problemlerden birisi, metadataların veritabanında tutulması, esneklikle ilgili problemler ve metadataların zaman içerisinde kaybedilmesi riskidir. (bilgi işlem tarafından yapılan çalışmalar esnasında kayıplar oluşabilir). Arama motorlarından ülkemizde en çok Lucene tabanlı olanlar kullanılır. Bunlardan bazıları Lucene, SOLR, Elastic Search vs. Genelde bu arama motorları Java programlama dili kullanılarak geliştirilmiştir. Bu arama motorlarının açık kaynak olmasına karşın bazı sorunlarının olduğu bilinmektedir. Bu sorunlar şu şekildedir: 1. Tamamen açık kaynak değillerdir, bazı bileşen ve kitaplıklar ticaridir ve katma değer elde etmek için bu bileşenlere ihtiyaç duyulmaktadır. 2. Yüksek hacimli sayısal arşiv uygulama örnekleri bulunmamaktadır. (10-15 milyonu aşan bir örnek uygulama olduğu hiç bir kaynak tarafından teyit edilmemektedir) Karşılaşılan müşteri problemlerinde, bu arama motorlarının 2 milyon civarında hacim gerektiğinde bile ciddi performans problemleri bulunmaktadır. 3. Belgeler manuel olarak indekslemeye tabi tutulmaktadır. 4. İndeks kataloglarında bozulmalar olması halinde yüksek bakım bedelleri (açık kaynak kod sahipleri tarafından) gündeme gelebilmektedir. 5.Açık kaynak kodlara karşı değiliz, ancak bu tür açık kaynak kodlara hakim olmayan ve sadece kullanıcı durumunda olan firmaların sorunlarla karşılaşması ve çözüm üretememesi gayet doğaldır. 6. Sezgisel istatiksel arama olanağına sahip değidirler. Sadece klasik "full text" olanağı ile yetinilmek durumundadır. 7. Metadata indekslemesi olanağı yoktur. XMP (Extensible Metadata Platform), yani PDF'e gömülü metadata söz konusu değildir. 8. Kriptolu belgeler indekslenememekte ve aranamamaktadır (Hasta bilgilerinin bir kısmı mahrem nitelikte olabilmektedir). 9. Dokümantasyon eksikliği söz konusudur. 10. Backward compatibility problemleri (sürüm yükseltilmek istendiğinde indeks kataloglarının yeniden oluşturulması gerektiği durumlar olabilmekte, genelde firma sürüm
  3. 3. Sayısal Arşiv Yönetim Sistemi 16 Mart 2015 Haluk ERYÜKSEL tarafından www.secube.com.tr hazırlanmıştır. 2 yükseltmeyi tercih etmediği için belli bir süre sonra teknolojik olarak eskime tehlikesi oluşmakta). Diğer bir indeksleme/arama motoru ise Google Search Appliance (GSA)'dır. Bu motor ise kapalı bir kutu halinde gelmektedir. Arşiv uygulamalarına uygun değildir. Microsoft SQL Server 2012/2014: MS SQL Server 2008 ile duyurulan FileStream teknolojisi sayesinde dünyada büyük arşivler tarafından yıllardır kullanılmakta olan ve arşivciliğe en uygun indeksleme motoru olanağını sunmaktadır. Bazı üstün özellikleri şu şekildedir: 1. Belgeler veri tabanı tarafından denetlenen bir dosya sisteminde yer alır. Bu sayede BLOB (binary) olarak belgelerin veritabanında tutulması gerekmez. SQL komutları ile dosya manipülasyonu yapılabildiği gibi her gün kullanmakta olduğumuz dosya işlemleri de kullanılabilmektedir. 2. Full text search ve sezgisel istatistiksel indeksleme olanaklarına sahiptir. 3. Halihazırda dünyada 200 milyon belgeyi aşan arşivlerde kullanıldığı bilinmektedir. 4. Dokümantasyon ve yaygın teknik destek olanakları bulunur. 5. Belgeler arşive katıldığı anda veya belgeler üzerinde değişiklik olduğu anda indekslenebilmesi sağlanır. 6. Belgelerin veritabanında tutulmaması sayesinde yapısal olmayan veriler üzerinde işlem yapılabilmesi. Yapısal verileri veritabanındaki tablolar olarak basitleştirebiliriz. Yapılan araştırmalar yapısal olmayan dünyadaki gerçek ihtiyaçların yapısallaştırılmaya çalışıldığı ve ancak başarının en fazla % 30-40 civarında olduğu yönünde. XML'in doğuşunda da yapısal olmayan verilerin hayata geçirilebilmesi ihtiyaçları bulunmaktadır. 7. Filtre eklentileri kullanılabilir. Oracle : Oracle full text ve veri güvenliği ile ilgili olanaklar sunmasına karşın, verilerin binary olarak tablolarda tutulması, arşiv uygulamalarının Oracle veritabanında oluşturulmasına engel arz etmektedir. Sayısal Arşiv Yönetim Sistemi ‘nde, yukarıda ayrıntılı olarak belirtilen özelliklerden dolayı MS SQL 2014 kullanıldı. Indeksleme motoru kullanılarak, üzerinde arama motoru gerçekleştirildi. Arama motorunun özellikleri şu şekildedir: 1. Türkçe dilinin yapısına göre arama yapılabilmesi (örneğin; olmak fiilini ele aldığımızda, ol, olmalı, olacak gibi pek çok kelime türetilebilir ve bunlar o ilgili kelime kökünden türeyen çözüm kümeleri olmalıdır. Bu sayede kelime kökü elde edilerek çözüm seti üzerinde de arama yapılabiliyor. Bunun için kelime sonuna "#" koymak yeterlidir. Örnek arama ifadesi : olacak#). Bu özellik diğer arama motorlarında bulunmamaktadır. 2. XMP standardında metadatalar indekslenebilir ve metadata veri adı ile aranabilir. 3. PDF'e gömülü XMP standardında esnek metadata kullanımı için IFilter plugin (bu tür plugin'ler SAYS haricinde dünyada 2 firma tarafından üretilmektedir) bulunmaktadır. 4. Kriptolu içerik indekslenebilir ve kriptolu içerikten yetki düzeyine göre arama yapılabilir.
  4. 4. Sayısal Arşiv Yönetim Sistemi 16 Mart 2015 Haluk ERYÜKSEL tarafından www.secube.com.tr hazırlanmıştır. 3 5. Yapısal olmayan metadatalar (XMP, PDF'in dışında ancak PDF ile birlikte dolaşan metadata dosyalarının kullanımı) kullanılabilir. 6. Metadata ve belgeler binary olarak veritabanında bulunmamakta, bu sayede yapısal veri mimarisinin bağımlığından kurtulunabilmekte ve hiç bir programlama gerekmeden esnek bir şekilde metadata ihtiyaçları çözülebilmektedir. 7. Bir belgeye ait birden fazla harici metadata kullanılabilmekte, indekselenebilmekte ve aranabilmektedir. (Örneğin zaman içerisinde çeşitli tasnif çalışmaları olabilir). 8. Araştırmacı veya kullanıcının not alabilmesi ve alınan notlardan arama yapılabilir. 9. Metadata, not vb. aramalarda ilgili belge görüntülenebilir. 10. Aranan kelime veya metadata veri unsurlarından, eşleşen kelime veya kelimelere ait paragraflar belge/metaveriden çekilip ekranda listelenebilir. 11. Her türlü belge ve arşiv malzemesi arşive katılabilir. 12. Kurumların kendi OCR yazılımı ile metadata veri unsurları elde edilebilir ve doğrudan taranan evraklar OCR'dan geçirilerek aranır hale getirilir. Sayısal Arşiv Yönetim Sistemi yukarıda genişçe yer verilen sahip olduğu katma değerli arama ve indeksleme motoru özellikleriyle milyonlarca belgenin arşivlenip, düzenlenmesinde, bu belgeler üzerinde arama yapılabilmesinde ve daha fazlasında büyük kolaylıklar sağlayacaktır. Haluk ERYÜKSEL Haluk Eryüksel 1960 yılında doğmuştur. Harp okulu Elektrik- Elektronik Mühendisliği (Lisans) ve Orta Doğu Teknik Üniversitesi Bilgisayar Mühendisliği (Yüksek lisans) mezunudur. Harp okulundan Albay olarak emekli olmuştur. Yazılım geliştirme, ilişkisel ve nesne yönelimli veri tabanları (özellikle büyük verilerde), dijital arşiv sistemleri, web teknolojileri, dijital elektronikler ve güç elektronikleri konuları üzerinde 32 yıldan fazla sürede uzmanlaşmıştır. Yenilenebilir enerji uygulamaları (güneş, çevre ve hidrojen) ve sensörler hakkında bazı araştırmaları bulunmaktadır. Şu anda Secube AR&GE Araştırma ve Geliştirme Mühendisliği’nde Genel Müdür pozisyonundadır.

×