E-learningová učebnice

Matematická biologie

Slovník | Vyhledávání | Mapa webu

Základy informatiky pro biologyDatabázové systémy v biomedicíně Vyhledávání v textu Regulární výrazy Použití regulárních výrazů v databázi POSTGRESQL

Cvičebnice jazyka R | Algoritmizace a programování | Analýza dat v R | Databázové systémy v biomedicíně |

Úvod do práce s databází |

Výstupy z výukové jednotky | Rozdělení databází podle typu | Databázové produkty | Přístup k databázi |

Připojení k POSTGRESQL | Připojení k ORACLE |

Datová struktura relační databáze |

Jména databázových objektů | Datové typy | Datový model |

Úlohy k procvičení |

Základy SQL |

Výstupy z výukové jednotky | Skupiny příkazů | DML příkazy |

SELECT | INSERT | UPDATE | DELETE | Databázové transakce |

DDL příkazy | Příkazy pro řízení přístupu |

Funkce a operátory v SQL |

Výstupy z výukové jednotky | Testování funkcí a operátorů | Operátory |

Základní operátory | Logické operátory | Množinové operátory |

Funkce |

Funkce nahrazující NULL | Funkce GREATEST a LEAST | Datumové funkce | Textové funkce | Funkce s číselným parametrem | Agregační funkce |

Úlohy k procvičení |

Pokročilé SQL |

Výstupy z výukové jednotky | Seskupování dat | Práce s více tabulkami |

Tři a více tabulek |

Vnořené dotazy | Úlohy k procvičení |

Analytické a statistické funkce SQL |

Výstupy z výukové jednotky | Funkce pro určení pořadí řádků ve výsledku - Ranking function | Funkce pro pro přístup k předchozím a následným řádkům - LAG (), LEAD () | Reportovací funkce | Statistické funkce |

Výpočet korelace | Párové statistické testy | Nepárové statistické testy | Jednofaktorová analýza rozptylu (one way ANOVA) | Binomický test | Lineární regrese |

Vyhledávání v textu |

Výstupy z výukové jednotky | Standardní funkce INSTR a operátor LIKE | Regulární výrazy |

Základy regulárních výrazů | Použití regulárních výrazů v databázi ORACLE | Použití regulárních výrazů v databázi POSTGRESQL | Shrnutí |

SQL skripty, uživatelské procedury a funkce |

Výstupy z výukové jednotky | Uložené procedury a uživatelské funkce | Základy databázového procedurálního jazyka | Vytváření uživatelských procedur a funkcí | Procedurální jazyk PG/SQL |

Export a import dat |

Výstupy z výukové jednotky | Export dat pomocí databázového klienta | Univerzální databázová rozhraní |

ODBC | OLEDB |

Import dat |

Import pomocí INSERT příkazů | Import dat pomocí SQLLDR (ORACLE) | Import přes externí tabulky (ORACLE) | Import do POSTGRESQL |

Základy XML |

Výstupy z výukové jednotky | Prvky XML | Jmenné prostory | XML schéma | XPath | Práce s XML v databázi |

Prohledávání a extrakce z XML | Jazyk XQuery | Generování XML |

XML v biomedicíně |

Literatura |

Teoretické základy informatiky | Výpočetní matematické systémy |

Použití regulárních výrazů v databázi POSTGRESQL

V databázi POSTGRESQL najdeme místo funkce REGEXP_LIKE() operátor "~" (vlnka), který provádí porovnání řetězce s regulárním výrazem s ohledem na velikost písmen (case sensitive), zatímco operátor "~*" porovnává shodu bez ohledu na velikost písmen (case insesitive).

Funkce REGEXP_SUBSTR() je v POSTGRESQL zastoupena funkcí SUBSTRING(), jejíž syntaxe je následující:

SUBSTRING(text, reg.vyraz)

Extrakci datumu z textového sloupce bychom tedy v databázi POSGRESQL provedli takto:

Oproti funkci REGEXP_SUBSTR() je tu užitečná výhoda, že můžeme ze specifikovaného regulárního výrazu extrahovat pouze omezenou část, kterou uzavřeme do kulatých závorek. Zatímco tedy předchozí příklad vrátí celé datum, v následujícím příkladu můžeme drobným doplněním regulárního výrazu získat pouze rok z nalezeného datumu:

Shodný název jak v databázi ORACLE tak POSTGRESQL mají funkce pro nahrazení nalezeného podřetězce za jiný text. Jde o funkci REGEXP_REPLACE(), kde rozdíl je pouze ve volitelných parametrech. Syntaxe v POSTGRESQL je:

REGEXP_REPLACE (text, reg.vyraz, novy_text [, priznaky ])

V prohledávaném textu je nahrazen nalezený vzor za nový text. Pomocí příznaků ovlivňujeme chování funkce. Nejdůležitější příznaky shrnuje tabulka 15:

Tab. 15: Přehled nejvýznamnějších příznaků funkce REGEXP_REPLACE v POSTGRESQL

Příznak	Význam
g	Nahradit všechny výskyty regulárního výrazu
i	Porovnávání bez ohledu na velikost písmen
c	Porovnávání s ohledem na velikost písmen

Pokud chceme v textu zamaskovat čísla hvězdičkou, můžeme použít toto řešení:

Příznak "g" zajistí, že budou zaměněny všechny nalezené číslice.

vytvořil Institut biostatistiky a analýz Lékařské fakulty Masarykovy univerzity