Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Dokuman Yonetimi Sistemi CubeBox-SAYS (Sayisal Arsiv Yonetimi)

251 views

Published on

Türkiye'nin ilk ve tek doküman yönetim sistemi ve elektronik arşiv earşiv sistemi bir arada yazılmı, doküman yönetim sistemine farklı bir bakış açısı getiriyoruz.

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

Dokuman Yonetimi Sistemi CubeBox-SAYS (Sayisal Arsiv Yonetimi)

  1. 1. SAYISAL ARŞİV YÖNETİM SİSTEMİ
  2. 2. SAYS Yazılımına Genel Bakış  Sayısal Arşiv Yönetim Sistemi (SAYS); milyonlarca belgenin kurallara göre insan hatası olmaksızın arşivlenmesi, bu belgeler üzerinden arama yapılabilmesini ve belgelerin imha,arşive kaldırılması zamanlarında olabilecek karmaşanın ortadan kaldırılmasını sağlar.
  3. 3. SAYS Yazılımının Başlıca AR-GE Niteliğindeki Özellikleri  Sayısal Arşiv Yönetim Sistemi ‘nin en önemli özellikleri; milyonlarca belgenin arşivlenmesi ve bunlar üzerinden arama yapılabilmesidir. Bu yüzden indeksleme ve arama motorları SAYS için önemli bir bileşendir.  Önemi ise özellikle alt yapının oluşturulmasından ve geleceğe yönelik mimarisinden kaynaklanmaktadır. Çünkü pek çok arşivde belge sayısı oldukça fazladır. Bu yüzden özenli ve düzgün bir mimari olmadığında telafisi oldukça güç olur. Emeklerin ve paranın boşa harcanması bir yana, töhmet altında kalınması ve işin sahiplenilmemesi de beraberinde gelir.
  4. 4. KARŞILAŞILAN CIDDI PROBLEMLER – TEKNOLOJININ BILINEN SON DURUMU
  5. 5. 1. Lucene, Elastic Search, SOLR ve Diğer Teknolojiler  Örneğin; karşılaşılan en ciddi problemlerden birisi, metadataların veritabanında tutulması, esneklikle ilgili problemler ve metadataların zaman içerisinde kaybedilmesi riskidir. (bilgi işlem tarafından yapılan çalışmalar esnasında kayıplar oluşabilir).  Arama motorlarından ülkemizde en çok Lucene tabanlı olanlar kullanılır. Bunlardan bazıları Lucene, SOLR, Elastic Search vs. Genelde bu arama motorları Java programlama dili kullanılarak geliştirilmiştir. Bu arama motorlarının açık kaynak olmasına karşın bazı sorunlarının olduğu bilinmektedir. Bu sorunlar şu şekildedir:
  6. 6. 1. Lucene, Elastic Search, SOLR ve Diğer Teknolojiler Belgeler manuel olarak indekslemeye tabi tutulmaktadır. Tamamen açık kaynak değillerdir, bazı bileşen ve kitaplıklar ticaridir ve katma değer elde etmek için bu bileşenlere ihtiyaç duyulmaktadır. Yüksek hacimli sayısal arşiv uygulama örnekleri bulunmamaktadır. (10-15 milyonu aşan bir örnek uygulama olduğu hiç bir kaynak tarafından teyit edilmemektedir) Karşılaşılan müşteri problemlerinde, bu arama motorlarının 2 milyon civarında hacim gerektiğinde bile ciddi performans problemleri bulunmaktadır. İndeks kataloglarında bozulmalar olması halinde yüksek bakım bedelleri (açık kaynak kod sahipleri tarafından) gündeme gelebilmektedir. Açık kaynak kodlara karşı değiliz, ancak bu tür açık kaynak kodlara hakim olmayan ve sadece kullanıcı durumunda olan firmaların sorunlarla karşılaşması ve çözüm üretememesi gayet doğaldır. 1 2 3 4 5
  7. 7. 1. Lucene, Elastic Search, SOLR ve Diğer Teknolojiler Kriptolu belgeler indekslenememekte ve aranamamaktadır (Hasta bilgilerinin bir kısmı mahrem nitelikte olabilmektedir). Sezgisel istatiksel arama olanağına sahip değidirler. Sadece klasik "full text" olanağı ile yetinilmek durumundadır. Metadata indekslemesi olanağı yoktur. XMP (Extensible Metadata Platform), yani PDF'e gömülü metadata söz konusu değildir. Dokümantasyon eksikliği söz konusudur. Backward compatibility problemleri (sürüm yükseltilmek istendiğinde indeks kataloglarının yeniden oluşturulması gerektiği durumlar olabilmekte, genelde firma sürüm yükseltmeyi tercih etmediği için belli bir süre sonra teknolojik olarak eskime tehlikesi oluşmakta). 6 7 8 9 10
  8. 8. 1. Lucene, Elastic Search, SOLR ve Diğer Teknolojiler Diğer bir indeksleme/arama motoru ise Google Search Appliance (GSA)'dır. Bu motor ise kapalı bir kutu halinde gelmektedir. Arşiv uygulamalarına uygun değildir. Oracle : Oracle full text ve veri güvenliği ile ilgili olanaklar sunmasına karşın, verilerin binary olarak tablolarda tutulması, arşiv uygulamalarının Oracle veritabanında oluşturulmasına engel arz etmektedir.
  9. 9. 2. Tercih Ettiğimiz Teknoloji ve Faydaları  Microsoft SQL Server 2012/2014: MS SQL Server 2008 ile duyurulan FileStream teknolojisi sayesinde dünyada büyük arşivler tarafından yıllardır kullanılmakta olan ve arşivciliğe en uygun indeksleme motoru olanağını sunmaktadır. Bazı üstün özellikleri şu şekildedir: Halihazırda dünyada 200 milyon belgeyi aşan arşivlerde kullanıldığı bilinmektedir. Belgeler veri tabanı tarafından denetlenen bir dosya sisteminde yer alır. Bu sayede BLOB (binary) olarak belgelerin veritabanında tutulması gerekmez. SQL komutları ile dosya manipülasyonu yapılabildiği gibi her gün kullanmakta olduğumuz dosya işlemleri de kullanılabilmektedir. Full text search ve sezgisel istatistiksel indeksleme olanaklarına sahiptir. 1 2 3
  10. 10. 2. Tercih Ettiğimiz Teknoloji ve Faydaları Belgelerin veritabanında tutulmaması sayesinde yapısal olmayan veriler üzerinde işlem yapılabilmesi. Yapısal verileri veritabanındaki tablolar olarak basitleştirebiliriz. Yapılan araştırmalar yapısal olmayan dünyadaki gerçek ihtiyaçların yapısallaştırılmaya çalışıldığı ve ancak başarının en fazla % 30-40 civarında olduğu yönünde. XML'in doğuşunda da yapısal olmayan verilerin hayata geçirilebilmesi ihtiyaçları bulunmaktadır. Dokümantasyon ve yaygın teknik destek olanakları bulunur. Belgeler arşive katıldığı anda veya belgeler üzerinde değişiklik olduğu anda indekslenebilmesi sağlanır. Filtre eklentileri kullanılabilir. 4 5 6 7
  11. 11. 3. MSSQL Kullanma Nedenlerimiz  Sayısal Arşiv Yönetim Sistemi ‘nde, yukarıda ayrıntılı olarak belirtilen özelliklerden dolayı MS SQL 2014 kullanıldı. Indeksleme motoru kullanılarak, üzerinde arama motoru gerçekleştirildi. Arama motorunun özellikleri şu şekildedir: Türkçe dilinin yapısına göre arama yapılabilmesi (örneğin; olmak fiilini ele aldığımızda, ol, olmalı, olacak gibi pek çok kelime türetilebilir ve bunlar o ilgili kelime kökünden türeyen çözüm kümeleri olmalıdır. Bu sayede kelime kökü elde edilerek çözüm seti üzerinde de arama yapılabiliyor. Bunun için kelime sonuna "#" koymak yeterlidir. Örnek arama ifadesi : olacak#). Bu özellik diğer arama motorlarında bulunmamaktadır. XMP standardında metadatalar indekslenebilir ve metadata veri adı ile aranabilir. 1 2
  12. 12. 3. MSSQL Kullanma Nedenlerimiz Yapısal olmayan metadatalar (XMP, PDF'in dışında ancak PDF ile birlikte dolaşan metadata dosyalarının kullanımı) kullanılabilir. PDF'e gömülü XMP standardında esnek metadata kullanımı için IFilter plugin (bu tür plugin'ler SAYS haricinde dünyada 2 firma tarafından üretilmektedir) bulunmaktadır. Kriptolu içerik indekslenebilir ve kriptolu içerikten yetki düzeyine göre arama yapılabilir. Metadata ve belgeler binary olarak veritabanında bulunmamakta, bu sayede yapısal veri mimarisinin bağımlığından kurtulunabilmekte ve hiç bir programlama gerekmeden esnek bir şekilde metadata ihtiyaçları çözülebilmektedir. Bir belgeye ait birden fazla harici metadata kullanılabilmekte, indekselenebilmekte ve aranabilmektedir. (Örneğin zaman içerisinde çeşitli tasnif çalışmaları olabilir). 3 4 5 6 7
  13. 13. 3. MSSQL Kullanma Nedenlerimiz Aranan kelime veya metadata veri unsurlarından, eşleşen kelime veya kelimelere ait paragraflar belge/metaveriden çekilip ekranda listelenebilir. Araştırmacı veya kullanıcının not alabilmesi ve alınan notlardan arama yapılabilir. Metadata, not vb. aramalarda ilgili belge görüntülenebilir. Her türlü belge ve arşiv malzemesi arşive katılabilir. Kurumların kendi OCR yazılımı ile metadata veri unsurları elde edilebilir ve doğrudan taranan evraklar OCR'dan geçirilerek aranır hale getirilir. 8 9 10 11 12
  14. 14. Sonuç Sayısal Arşiv Yönetim Sistemi yukarıda genişçe yer verilen sahip olduğu katma değerli arama ve indeksleme motoru özellikleriyle milyonlarca belgenin arşivlenip, düzenlenmesinde, bu belgeler üzerinde arama yapılabilmesinde ve daha fazlasında büyük kolaylıklar sağlayacaktır.
  15. 15. SAYISAL DEĞER ARŞİV YÖNETİM SİSTEMİ (SAYS)
  16. 16. Ürün Özellikleri WEB tabanlı, ASP.NET teknolojileri (.Net FrameWork 4.5.2) Belge sınırı bulunmamaktadır. Milyarlarca sayfa belge ve yüzlerce Peta Byte kapasitelerden yararlanılabilmektedir. Arama hızı saniyeler mertebesindedir ve belge sayısı arama hızını etkilememektedir. Arama hızı aramanın kompleksliğine bağlı olarak saniyeler mertebesindedir. Çeşitli arama yöntemleri arasında kolay geçiş olanağı. Yetkili olunmayan fonlarda belge varlığı aranabilmektedir (belge varlığı arama yetkisi verildiği taktirde). Belge kimlik bilgileri yapısal değildir. Tamamen esnek ve metin tabanlıdır, veri tabanı kullanılmamaktadır. Dosya gezgini özelliği. Dosya gezginini kullanarak dosya ekleme, dosya silme (yetki verilen kullanıcılar için). Çöp tenekesi yapısında silinen dosyaların kayıt altına alınması.
  17. 17. Ürün Özellikleri Fon bazında, alt fon, klasör, kutu bazında, gömlek bazında ve/veya belge bazında belge kimlik bilgileri oluşturabilme. Belge kimlik bilgileri sayısında herhangi bir sınır bulunmaktadır. Örneğin bir belgeye ait çeşitli zamanlarda yapılan çalışmalar sonucunda istenen sayıda belge kimlik bilgisi olabilmektedir. ABBYY Recognition Server, ABBYY Fine Reader, ABBYY FlexiCapture ve diğer optik karakter tanıma sistemleri ile uyumludur. Taranan belgeler OCR işleminden geçtikten sonra otomatik olarak indekslenir, herhangi bir kullanıcı müdahalesine gerek bulunmaz. Ekran resminin çekilmesini önlemek ve caydırmak maksadı ile belgeye erişen kullanıcı için o an üretilen kodun dört diagonal şeffaf filigran olarak görüntülenmesi.
  18. 18. Ürün Özellikleri Sorgulama ve belge erişiminin IP adresi, kullanıcı, tarih-saat, sorgu ve erişilen belge olarak tarihçesinin tutulması/kayıt altına alınması. Aktif dizin hizmetleri (LDAP veya AD) ile sisteme erişim ve doğrulama, müşteriye özgün doğrulama ve erişimin sağlanması. SECUBE CentraCUBE İş akış Yönetim Sistemi (Microsoft Workflow Foundation temelli) ile entegre yapı.
  19. 19. Ürünün Öne Çıkan AR-GE Nitelikleri İş akış yönetim sistemi ile arşiv malzemelerinin birim ve kurum arşivlerine saklama-imha planlarına uygun olarak iletilmesi. Elektronik Belge Yönetim Sistemleri ile kolayca entegre olabilme. Fon/alt fon/katalog bazında kullanıcı yetkisi atayabilme. Aynı yapı içerisinde farklı arşivler oluşturabilme. Çeşitli arama yöntemleri arasında kolay geçiş olanağı.
  20. 20. Ürünün Öne Çıkan AR-GE Nitelikleri Gelişmiş rol bazlı kullanıcı yönetimi ile içerikte arama, belge kimlik bilgilerinde arama, dosya gezgini, dosya düzenleme (dosya silme, dosya yükleme gibi), belge kimlik bilgisi düzenleme, belge varlığı arama yetkilendirmeleri. Yetkilendirmeler rol ve birim bazında olabilmektedir. Arşiv niteliklerinin yanı sıra kurumsal hafıza için de kullanılmaktadır. Bu sayede kurum/şirkete ait tüm doküman, dosyalardan çalışanlar yararlanabilmekte ve çok kısa sürede istedikleri bilgilere erişebilmektedirler. Her türlü formattaki dosya biçimleri kullanılabilmektedir. Bunlardan bazıları PDF, Word, Excel, PowerPoint, XML, text, RTF, vb. Birim, kurum ve şirket arşivlerinde ise standart olarak PDF/A dosya biçimi kullanılabilmektedir. PDF sürüm 1.3, 1.4, 1.5, 1.6, 1.7, PDF/A sürüm 1a, 1b, 2a, 2b, 2u sürümleri ile uyumludur. Herhangi bir aranabilir PDF formatı istenilen PDF sürüm/formatında görüntülenebilir.

×