Redakční rada

Nabídka akcí

Fenomén Big Data jako trend ovlivňující technické zpravodajské disciplíny

Tento odborný článek se snaží pojednat o problematice Big Data a možném využití tohoto současného fenoménu v oblasti zpravodajských disciplín založených na technických metodách sběru dat a jejich relevantním vyhodnocování. Úvodní část je věnována problematice vývoje bezpečnostního prostředí a poskytuje obecný přehled o současných trendech v oblasti technických zpravodajských oborů. V další kapitole je proveden rozbor hlavních trendů, konkrétně digitalizace bojiště, nárůstu objemu informací a vývoji nových technologií. Následující část je věnována základnímu terminologickému popisu problematiky Big Data, což vyúsťuje v závěrečné zhodnocení a určitou predikci dalšího vývoje v této oblasti a nárůstu významu tohoto trendu pro zpravodajské disciplíny v budoucnu.

Další informace

  • ročník: 2014
  • číslo: 4
  • stav: Recenzované / Reviewed
  • typ článku: Ostatní / Other

1. Úvod

V úvodu je vhodné položit důraz na významné odlišnosti vzešlé z komparace obecných vojenských strategií současnosti a minulosti související s predikcí vývoje bezpečnostního prostředí a identifikací významných hrozeb.

V minulosti byla pro západní společnost identifikována výhradně jedna významná hrozba reprezentovaná bývalým Svazem sovětských socialistických republik, jež byla vysoce pravděpodobná, a také vysoce předvídatelná ve způsobu nasazených sil, jejich očekávané struktury, výzbroje a možného operačního tempa při nasazení. Hlavními atributy této hrozby bylo jaderné odstrašování a obranné strategie západních mocností byly proto zaměřeny na sestavení adekvátního celku sil a prostředků s obdobnými úkoly a poměrem druhů sil.

V současné době však existuje pro západní společnost mnoho odlišných a velmi aktuálních hrozeb, u nichž je naopak nejistá pravděpodobnost a velmi nízká předvídatelnost. Jakákoliv forma odstrašování není v současné době již plně relevantní a strategie musí být sestavena tak, aby byla připravena na nejistotu a šok.

Tyto skutečnosti mají velmi významný dopad také na hodnocení a predikci vývoje bezpečnostní situace v celosvětovém měřítku z pohledu zpravodajských subjektů. Je nutné proto reflektovat tyto skutečnosti a přizpůsobit činnosti zpravodajského cyklu ve všech jeho fázích tomu, aby zpravodajské služby České republiky partnerských členů Evropské unie a Severoatlantické aliance byly schopny reagovat na dynamiku turbulentního prostředí a objektivně analyzovat, hodnotit a predikovat bezpečnostní hrozby pro Českou republiku a nadnárodní organizace, jichž je Česká republika členem.

2. Trendy v oblasti technických zpravodajských oborů

Trendy současného vývoje bezpečnostní a vojensko-politické situace v rizikových a krizových oblastech světa jsou nejen z pohledu globálního, ale také z pohledu regionálního či národního jedním z hlavních faktorů mající ať už přímý, či nepřímý dopad na ekonomické ukazatele a další strukturální indikátory všech zemí, včetně České republiky.

V rámci bezpečnostního prostředí a jeho dynamického vývoje je nutné v celosvětovém měřítku potlačovat hrozby nejrůznějšího charakteru, které mají dopad na zájmy, a především bezpečnost jednotlivých státních aktérů a nadnárodních organizací. V této souvislosti je potřeba věnovat zvýšenou pozornost rozvoji a efektivitě činnosti zpravodajských subjektů, kdy je položen největší důraz na kontinuální rozvoj schopností zpravodajských disciplín závislých zejména na technických metodách sběru dat a informací a na jejich relevantním vyhodnocování. Jedná se především o SIGINT (Signal Intelligence), COMINT (Communications Intelligence), ELINT (Electronic Intelligence), FISINT (Foreign Instrumentation Intelligence), MASINT (Measurement and Signature Intelligence) a IMINT (Imagery Intelligence). [1]

Pokud byl výše zmíněn důraz na rozvoj schopností zpravodajských disciplín závislých na technických metodách sběru dat a jejich relevantním vyhodnocování, je nutné zmínit hlavní současné trendy mající přímý vliv na vývoj těchto specifických zpravodajských disciplín. Přestože se několik odborníků a specialistů snaží predikovat určité trendy ve vývoji v oblasti signálového zpravodajství a dalších technicky založených zpravodajských oborů, je předpověď vývoje používaných technických, informačních a komunikačních prostředků protivníkem v budoucích operacích téměř nemožné, zejména ve střednědobém a dlouhodobém horizontu.

V určité míře lze na bázi teoretického poznávání a bádání a s ohledem na vývoj komunikačních a informačních technologií (IKT) v komerční sféře předpokládat, jakými směry se budou jednotlivé obory pravděpodobně ubírat, a v krátkodobém horizontu se lze pokusit o racionální predikci. Je zřejmé, že současný výzkum a vývoj komerčního sektoru v oblasti informačních a komunikačních technologií ve srovnání s výzkumem vojenským je na vzestupu a tento trend lze očekávat i do budoucnosti.

Dalším problémem je také limitace v předpovídání vývoje bezpečnostní prostředí v celosvětovém měřítku, což má přímý dopad na všechny zpravodajské disciplíny, signálové, obrazové a další technické obory zpravodajství nevyjímaje. Pokud bereme v potaz nejzávažnější faktory mající dopad na vývojové trendy v oblasti zpravodajských oborů závislých na technických metodách sběru dat a jejich vyhodnocování, je přínosné zdůraznit zejména digitalizaci bojiště, nárůst objemu informací, zavádění nových technologií, zejména souvislost těchto faktorů se současným fenoménem označovaným jako Big Data.

2.1 Digitalizace dat

Kontinuální vývoj a inovace používaných technologií zapříčinila určitou revoluci v rámci bojiště, a nadále má velký vliv na samotné vedení operací. Hlavní výhodou digitalizace v obecném pohledu je možnost získávat stále větší objem dat, a potažmo i zpravodajských informací a na takto digitalizovaná data i utříděné informace lze aplikovat mnohem větší množství specifických metod pro zpracování, analýzu, spravování, třídění a výběr. Digitalizovaná data jsou v současné době mnohem rozšířenější než data ve formě analogové, nicméně v některých případech samotná digitalizace právě dat analogových skrývá problém ve snížení kvality těchto dat, kdy narůstá chybovost jednotlivých subsystémů a systému jako celku. [2]

Jedním ze základních parametrů pro hodnocení kvality přenosu analogových komunikačních a informačních systémů je jejich výstupní poměr signálu k šumu označovaném S/N (Signal to Noise). U digitálních komunikačních a informačních systémů je základním parametrem obdobného významu jejich chybovost BER (Bit Error Rate). Chybovost v této souvislosti bývá nejčastěji definována jako poměr chybně přenesených elementů digitálního signálu k celkovému počtu přenesených elementů, a to za určitou dobu měření.

U digitálních systémů se v praxi nejčastěji setkáváme s chybovostí bitovou, která je definována jako poměr chybně přijatých bitů k celkovému počtu přijatých bitů za určitou dobu měření. [3] Nejvyšší přípustné hodnoty této veličiny závisí na konkrétních aplikacích a použitých typech modulací. [4] Matematické vyjádření tohoto typu chybovosti je znázorněno následujícím vyjádřením:

Havlik vzorec

kde:
vp je přenosová rychlost [bit/s],
t  je celková doba měření [s]
bE je počet chybně přijatých elementů [bit]

Z pohledu signálového zpravodajství a dalších technických zpravodajských disciplín je taktéž patrné, že zpracovávání digitalizovaných dat je poměrně rychlejší, tím dochází také k urychlení rozhodovacích procesů velitelů, kteří využívají zpravodajské informace. Nutno však v této části dodat, že se zvyšujícím se objemem digitalizace narůstá zmiňovaná chybovost jednotlivých subsystémů a celého systému jako celku, včetně nárůstu možností a příležitostí pro napadení těchto systémů protivníkem.

Problematika se však nedotýká pouze oblasti signálového zpravodajství, ale zasahuje také značným způsobem do oblasti elektronického boje (EB). [5] S ohledem na určité trendy v oblasti EB lze do budoucna očekávat, že dojde k určitému propojení se signálovým zpravodajstvím SIGINT, především na taktické a operačním stupni při společné podpoře úkolových uskupení v budoucích operacích.

2.2 Objem informací

Nejen v souvislosti s vývojem nových komunikačních a informačních technologií, ale také v souvislosti s digitalizací (nejen výše zmiňovaného bojiště) je v posledních letech patrný nárůst počtu zdrojů dat a informací obecně, [5] a od toho se samozřejmě odvíjí také nárůst potencionálních zpravodajských informací, kterou mohou sloužit v rámci rozhodovacího procesu velitele.

Při správném využívání informací (zejména po ověření jejich věrohodnosti a dalších atributů) mohou tyto efektivně posloužit velitelům na všech hierarchických úrovních při rozhodování v rámci svých pravomocí a plánování úspěšných a efektivních operací. V této souvislosti je nutné připomenout, že pokud nejsou zabezpečeny potřebné prostředky (softwarové nástroje, hardware, databáze, selekční a identifikační systémy, analytické nástroje, atd.) pro práci s daty, hrozí zahlcení velitele množstvím neuspořádaných a nežádoucích dat či informací.

Diskutovaný objem dostupných informací skýtá proto určitou ambivalentnost, kdy na jedné straně je se zvyšujícím se objemem dat zřejmý vyšší potenciál zájmových zpravodajských a dalších využitelných informací, na straně druhé hrozí zahlcení a kolaps příslušných systémů. Je nutné tedy v budoucnu věnovat pozornost nejen samotnému sběru informací a zpravodajských informací prostředky signálového zpravodajství, ale rovněž zajistit kontinuální aktualizaci nástrojů pro správu takto získaných informací ve všech možných souvislostech. K tomuto účelu je vhodné aplikovat nové přístupy pro práci s velkými objemy dat – tedy věnovat se problematice označované jako Big Data (více viz podkapitola 2.4 a kapitola 3).

2.3 Nové technologie

Neustálý vývoj a vznik nových technologií i technických systémů klade vysoké požadavky jak na fundovanost příslušníků zpravodajských disciplín, tak rovněž na vlastní vývoj veškerých specifických komunikačních a informačních prostředků. V této fázi nelze nezmínit ani vliv nových technologií a prostředků na způsob řízení elementů signálového a obrazového zpravodajství implementovaných do sestav úkolových uskupení v soudobých i budoucích operacích. Lze s vysokou jistotou předpokládat, že na vývoj v oblasti nových technologií a prostředků budou bezprostředně reagovat taktéž nestátní aktéři, včetně těch zapojených do extremistických a teroristických aktivit v asymetrickém způsobu boje. Zavádění nových technologií ve specifické oblasti signálového zpravodajství umožňuje rozšiřovat portfolio vyhledávání zpravodajských informací ze stále se rozšiřujícího spektra sub-zdrojů, popřípadě agentur.

Zvyšující se nárůst potencionálně zájmových zpravodajských informací s ohledem na vytěžování nových technologií a systémů klade velmi vysoké nároky na finanční zdroje vyčleněné pro tyto potřeby. Trendy v této oblasti se přesouvají od běžných komunikačních prostředků k širšímu využívání webového rozhraní, a to už jak v oblasti sociálních sítí či VoIP telefonie (Voice over Internet Protocol). [7]

2.4 Big Data

Pokud byly v předcházející části specifikovány určité vývojové trendy související s nárůstem informací, jejich digitalizací a vývojem nových technologií, je v této části vhodné také zmínit současný fenomén označovaný jako Big Data. Jedná se o specifickou kategorii velkokapacitních souborů dat v obecném pohledu jak strukturovaných, tak i nestrukturovaných. Tato data jsou ukládána do specifických datových skladů a jsou na ně následně aplikovány analytické metody využívající nejrůznější matematické algoritmy. Obvykle se v datových skladech pracuje s objemy dat o velikosti terabytů a výše. [8]

Podle předpokladů a analýz komerční společnosti IBM se v roce 2015 předpokládá nárůst objemu dat na 8000 až 9000 exabytů (1 EB = 1018 bytů). Celkový počet účtů na sociálních sítích a multimediálních serverech překročí v roce 2015 celosvětový počet obyvatel a počet síťových zařízení pracujících na platformě internetu bude minimálně dvojnásobný, než bude v roce 2015 celosvětová populace. [9]

3. Big Data – terminologie a působnost

V nejrůznějších primárních či sekundárních zdrojích se mnohdy vyskytuje také počeštěné mutace původního termínu Big Data, konkrétně tedy veledata, velká data či superdata. Ani jeden z těchto českých ekvivalentů není podle nejnovějších informací doposud jednoznačně ustálen a používán dogmaticky, a proto bylo zvoleno v celém odborném článku použití původního označení Big Data.

Pokud budeme chtít co nejvěrohodněji definovat význam Big Data, je nejvhodnější použít model, kdy se v případě velkoobjemových dat jedná o taková data, která splňují některé z kritérií, jejichž anglický význam začíná na písmeno V. V této souvislosti jde především o následující:

  • Volume (objem) – velké množství dat, kdy se v dnešní době vyskytují objemy dat od kapacity jednotek TB (terabyty) do ZB (zettabyty).
  • Velocity (rychlost) – velká rychlost dat a také rychlost zpracovávaných analýz z takto dostupných dat. Rychlost dat je často přímo závislá na přenosových rychlostech dotčených informačních a komunikačních systémů.
  • Variety (rozmanitost) – různorodé a proměnlivé formáty dat a jejich strukturovanost. V této souvislosti je vhodné zmínit text, hlas, multimédia atd.
  • Veracity (pravdivost) – věrohodnost dat, jejich rozporuplnost, dvojznačnost, skrytost, klamnost, podvratnost, atd.
  • Variability (variabilita) – proměnlivost dat, a to zejména z hlediska času.

Půl století poté, co se počítače začaly běžně používat, došlo k takové akumulaci dat, že se děje něco nového a zvláštního. Kromě toho, že je svět zaplaven více informacemi než kdykoliv dříve, narůstá navíc stále rychleji i objem těchto informací.

3.1 Datová exploze

Změna měřítka způsobila změnu stavu. Kvantitativní změna se proměnila na kvalitativní. Vědy jako astronomie a genomika, které tuto datovou explozi zažily nejdříve (v prvním desetiletí tohoto století), přišly s termínem Big Data. Tato zavedená koncepce se nyní šíří do všech oblastí lidské činnosti. [10]

Big Data se v současné dynamicky měnící se době stávají velmi důležité v mnoha oblastech komerční sféry a státního sektoru, kdy data o velkých objemech nejen ovlivňují jednotlivé segmenty trhu, ale také mění samotnou podobu konkrétních odvětví, a právě efektivní práce a využívání dat o velkém objemu představuje v dnešní době velkou konkurenční výhodu. Tento trend lze s velkou pravděpodobností předpokládat i do budoucnosti.

V souladu s vládními nařízeními, nutnou regulací i kontrolou a potřebnou činností zpravodajských subjektů a orgánů činných v trestním řízení, je s ohledem na výše zmíněné trendy nutné reflektovat nárůst archivovaných elektronických dokumentů, včetně e-mailů a do nich zakomponovaných příloh, a veškeré elektronické komunikace (sociální sítě, messangery, VoIP, atd.). Tyto skutečnosti proto předpokládají velmi intenzivní budoucí využití fenoménu Big Data také v oblasti zpravodajství, signálového a obrazového zpravodajství nevyjímaje, které se právě využitím, analýzou a archivací elektronických komunikací a dokumentů hluboce zabývá ve smyslu získávání důležitých informací, v prvé řadě zpravodajských informací.

Jak již bylo zmíněno, ukládání a analýza Big Data poskytuje velké možnosti nejen pro zpravodajské analytiky, kteří zde mohou aplikovat nejrůznější metody vizualizace či dataminingových nástrojů (specifických nástrojů – většinou softwarové produkty – umožňující vyhledávat vhodné vzorce v dostupných datech, na která poté aplikuje specifické a známé statistické postupy), ale také pro komerční subjekty, které se potýkají s velkým nárůstem dat v posledních letech.

4. Vývoj a vliv trendů na zpravodajskou činnost

V předcházejících kapitolách byly uvedeny hlavní trendy mající nejintenzivnější dopad na vývoj zpravodajských disciplín založených na technických metodách sběru a vyhodnocování dat. V této souvislosti je zde vhodné popsat vliv těchto trendů a jejich další předpokládané směřování ve zpravodajské oblasti v následujících letech.

Podle závěrů odborné studie organizace Digital Universe IDC je nárůst objemu dat v posledních letech rychlejší než udává Moorův zákon. [11] Nárůst objemu těchto dat o zájmových subjektech, jejich aktivitách, vazbách a dalších souvislostech indikuje nutnost tyto data efektivně, hospodárně a účelně spravovat, aby je bylo možné ve všech fázích zpravodajské činnosti využívat dle potřeb zpravodajských subjektů na národní i mezinárodní úrovni, a to primárně pro rozhodovací procesy oprávněných adresátů.

V této fázi je velmi důležitá jak problematika vizualizace těchto dat, která má přímý vliv na výslednou interpretaci a distribuci zpravodajských informací, tak další obsahová i provozně-technická analýza, která nabývá na důležitosti ve všech současných krizových oblastech v globálním pohledu. Tyto činnosti budou mít v budoucnosti velmi významný dopad na samotnou konkurenční schopnost jednotlivých zpravodajských subjektů a budou reprezentovat základní silné nebo slabé stránky výsledné činnosti těchto subjektů s vlivem na očekávanou udržitelnost zpravodajských schopností.

Podle dostupných informací je problematika využívání a implementace nástrojů Big Data výrazně nápomocna jak samotnému strategickému rozhodování, tak každodennímu řízení vnitro-organizačních procesů. Smyslem v následujících letech bude stále efektivněji nahrazovat velmi nákladné lidské zdroje a urychlit proces jednotlivých zpravodajských analýz specifických zpravodajských disciplín, a to primárně v návaznosti na všezdrojové zpravodajství (All Source Intelligence).

Správně interpretovaná data budou v budoucnu předpokladem k tomu, aby daná společnost (organizace) lépe porozuměla vnitřním procesům a hledala nové způsoby, jak toto dále pozitivně ovlivňovat, minimalizovat všechna související rizika, efektivněji hospodařit a zejména věrohodněji a v reálném čase predikovat budoucí vývoj bezpečnostního prostředí se všemi zájmovými faktory a ukazateli. Budoucí cesta ve využívání dat velkého objemu je v hledání trendů a aspektů, které tyto trendy přímo či nepřímo ovlivňují, a poté se těchto trendů držet (pokud prezentují příležitosti) nebo se jich vyvarovat (pokud prezentují hrozby).

Hlavní přínosy nových trendů pro ovlivněné zpravodajské disciplíny (zejména SIGINT, ELINT, COMINT, IMINT a FISINT) lze do budoucna spatřit v samotném novém propojení dat do souvislostí (vizualizace událostí a aktivit zájmových zpravodajských subjektů), což přináší dle nejnovějšího zjištění narůstající možnosti nových pohledů na sledované subjekty a také výše avizované snížení nákladů na lidské zdroje. Do budoucna lze dále očekávat, že se bude stále více rozvíjet práce na datech velkého objemu z veřejných datových zdrojů (rejstříky státní správy, informační databáze a služby nejrůznějšího charakteru apod.).

Nejdůležitějším záměrem pro zpravodajské služby by mělo být to, abychom se nevěnovali hlavním úsilím popisu stávajících jevů (to co se v oblastech zpravodajského zájmu událo), ale naopak výhradně predikci toho, co může v budoucnu nastat v nejrůznějších pravděpodobnostních variantách, a jak na tyto možnosti reagovat v rámci řízení možných rizik. [12, 13] Současné analytické nástroje (nejen v oblasti zpravodajství) se velmi intenzivně rozšiřují právě o elementy, procedury, funkcionality a další dílčí nástroje, které využívají analýzu dat o velkém objemu, umožňují jejich vícekriteriální vizualizaci, a to jak dat strukturovaných, dat v budoucnu stále více také dat nestrukturovaných z vlastních i externích zdrojů. [14]

Na významu budou nabývat také citlivá data sdílená prostřednictvím moderních sociálních sítí (Facebook, Twitter, Google+, LinkedIn, Naymz, Xing, MySpace, Orkut, Bebo, Classmates, Friendster, Hi5, Blackplanet, atd.). S nárůstem objemu dat bude v budoucnu také narůstat potřeba na vysoký výpočetní výkon počítačů a změnu základní počítačové architektury, kdy bude využíváno sdíleného výkonu, pozornost bude věnována zrcadlení diskových polí, vzdáleným úložištím a podobně. Mezi nejrozšířenější metody bude pravděpodobně patřit DataMining, simultánní zpracování dat MPP (Massively Parallel Processing), strojové učení (Machine Learning) a prediktivní modelování v návaznosti na rozhodovací procesy velitelů (nejen v oblasti zpravodajských služeb). [15]

5. Závěr

Big Data v současné době představují jeden z nejvýznamnějších vlastnických aktiv v oblasti informačních technologií u komerčních i státních subjektů a do budoucna jejich význam dále poroste. Souhrnně jde o taková data, která jsou postavena mimo oblast standardního zpracování běžnými softwarovými a hardwarovými nástroji současných uživatelských stanic, zejména při jejich zpracování v reálném čase. Toto je pro potřeby zpravodajských subjektů jednou z klíčových vlastností současných i budoucích prostředků. Do budoucna lze očekávat, že se teoretické pojetí problematiky Big Data rozroste o jejich praktické využívání nejen zpravodajskými subjekty v globálním měřítku, ale bude věnována pozornost jejich dosti problematické struktuře, jejího uspořádání a případné fragmentace, vzrůstajícímu objemu a náročnosti zainteresovaných systémů na rychlost zpracování dat.

Tyto skutečnosti generují dva základní pohledy do budoucnosti ve využívání a vývoji nových softwarových nástrojů (databázové projekty) a hardwarových prostředků, které užívají výkon několika jader (případně sdílejí výkon několika stanic s více jádrovými procesory prostřednictví sítě). V oblasti zpravodajství skýtá problematika Big Data široké možnosti ve využití specifických analýz především sociálních sítí, jež jsou typické značně nestrukturalizovanými daty, a také dynamickým vývojem v posledních letech.

Big Data otevírají do budoucna široké možnosti ke zcela podstatným změnám, a to jak v řízení komerčních podniků, tak v oblasti výzkumu či vědy, a v neposlední řadě také při rozhodování státních institucí a vrcholových představitelů státu, včetně rezortu obrany a vlády České republiky.

 

 

 

Plk. gšt. PhDr. Ing. Martin HAVLÍK, Ph.D., DBA, MBA, MSc., LL.M. Pracovník Ministerstva obrany České republiky. Specializuje se na zpravodajskou problematiku, zejména pak na oblast technických zpravodajských disciplín, informačních a kybernetických operací jakožto nedílné součásti hybridního působení státních i nestátních aktérů. Mimo uvedené se dlouhodobě zaměřuje na analýzy bezpečnostních hrozeb a rizik s dopadem na obranu a bezpečnost České republiky.

 

06/04/2023

Zanechat komentář