Новости

Записки и мысли: Кириллические символы (не UTF-8) в PostgreSQL

Добавил(а) Михаил Губин 4 месяца назад

Кириллические символы являются важной частью многих языков, включая русский, украинский, белорусский и другие. Однако, при работе с базами данных, такими как PostgreSQL, необходимо учитывать особенности кодировки символов. В этой статье мы рассмотрим, как правильно экранировать кириллические символы в PostgreSQL, чтобы избежать ошибок и проблем с отображением данных.

Что такое экранирование?

Экранирование – это процесс добавления специальных символов к строке текста для предотвращения интерпретации некоторых символов как управляющих. Это особенно важно при работе с базами данных и скриптами, где некоторые символы могут иметь специальное значение.

Почему нужно экранировать кириллические символы?

PostgreSQL использует кодировку UTF-8 по умолчанию, которая поддерживает большинство символов, включая кириллические. Однако, если вы работаете с данными, которые были сохранены в другой кодировке, например, Windows-1251, вам может потребоваться экранировать кириллические символы, чтобы они корректно отображались в PostgreSQL.

Как экранировать кириллические символы?

Для экранирования кириллических символов в PostgreSQL можно использовать функцию encode(). Эта функция принимает два аргумента: имя кодировки и строку, которую нужно преобразовать. Например, если у вас есть строка в кодировке Windows-1251 и вы хотите преобразовать ее в UTF-8, вы можете использовать следующий код:

SELECT encode('строка в Windows-1251', 'UTF-8');

Этот код преобразует строку 'строка в Windows-1251' в UTF-8 и возвращает результат.

Примеры команд

Давайте рассмотрим несколько примеров команд, которые помогут вам экранировать кириллические символы в PostgreSQL:

Преобразование строки в UTF-8:

SELECT encode('Пример строки в Windows-1251', 'UTF-8');

Преобразование столбца таблицы в UTF-8:

UPDATE my_table
SET my_column = encode(my_column, 'UTF-8')
WHERE my_column IS NOT NULL;

Преобразование всех строк в UTF-8:

ALTER TABLE my_table ALTER COLUMN my_column TYPE TEXT USING encode(my_column, 'UTF-8');

Создание новой таблицы с колонками в UTF-8:

CREATE TABLE my_new_table (
    my_column TEXT DEFAULT ''::TEXT NOT NULL
);

Записки и мысли: Кириллические символы в запросах и базах PostgreSQL

Добавил(а) Михаил Губин 4 месяца назад

Кириллические символы в запросах и базах PostgreSQL

PostgreSQL — это система управления базами данных (СУБД), которая поддерживает множество языков программирования и позволяет использовать различные типы данных, включая кириллические символы. В этой статье мы рассмотрим, как работать с кириллическими символами в запросах и базах данных PostgreSQL.

Использование кириллических символов в запросах¶

PostgreSQL поддерживает Unicode, поэтому вы можете использовать любые кириллические символы в своих запросах. Однако, если вы работаете с кодировкой, отличной от UTF-8, вам может потребоваться указать эту кодировку при подключении к базе данных.

Пример использования кириллических символов в запросе:

SELECT * FROM users WHERE name = 'Иван';

В этом примере мы выбираем все записи из таблицы users, где имя пользователя равно 'Иван'.

Хранение кириллических символов в базах данных¶

PostgreSQL также поддерживает хранение кириллических символов в своих базах данных. Вы можете использовать различные типы данных для хранения таких символов, включая VARCHAR, TEXT и CHAR.

Пример создания таблицы с использованием кириллических символов:

CREATE TABLE users (
    id SERIAL PRIMARY KEY,
    name VARCHAR(255) NOT NULL,
    email TEXT NOT NULL
);

В этом примере мы создаем таблицу users с полями id, name и email. Поле name имеет тип VARCHAR, который позволяет хранить строки переменной длины, включая кириллические символы. Поле email имеет тип TEXT, который также поддерживает кириллические символы.

Преобразование кодировок¶

Если вы работаете с данными, которые были сохранены в другой кодировке, вам может потребоваться преобразовать их в UTF-8 перед использованием в PostgreSQL. Для этого можно использовать функцию convert_to или convert_from в зависимости от того, хотите ли вы преобразовать данные в UTF-8 или из UTF-8.

Пример преобразования кодировки:

UPDATE users SET name = convert_to('UTF-8', name) WHERE name IS NOT NULL;

В этом примере мы преобразуем все имена пользователей в таблице users из текущей кодировки в UTF-8.

Записки и мысли: Лексическая структура PostgreSQL

Добавил(а) Михаил Губин 4 месяца назад

PostgreSQL — это объектно-реляционная система управления базами данных (СУБД), которая является одной из самых популярных и мощных СУБД в мире. Она поддерживает множество функций и возможностей, включая сложные типы данных, такие как массивы, геометрические данные, временные ряды и другие. В этой статье мы рассмотрим лексическую структуру PostgreSQL, то есть как она обрабатывает и интерпретирует SQL-запросы.

Основные элементы лексической структуры PostgreSQL¶

PostgreSQL использует следующий синтаксис для определения основных элементов лексической структуры:

<statement> ::= <query statement> | <command>
<query statement> ::= SELECT [ ALL | DISTINCT [ ON ( <sort_list> ) ] ] <select_list>
    FROM <from_clause>
    [ WHERE <condition> ]
    [ GROUP BY <group_by_list> ]
    [ HAVING <condition> ]
    [ ORDER BY <order_by_list> ]
    [ LIMIT { <count> | ALL } ]
    [ OFFSET { <count> | ZERO } ]
<command> ::= <unreserved_keyword> [ <arg> [, ...] ]

Как видно из этого синтаксиса, PostgreSQL поддерживает два основных типа запросов: SELECT и COMMAND. SELECT используется для выборки данных из базы данных, а COMMAND используется для выполнения различных команд, таких как создание таблиц, удаление данных и т.д.

Комментарии¶

Комментарии в PostgreSQL начинаются с двух дефисов (--) и продолжаются до конца строки. Они используются для добавления заметок к коду, которые не влияют на выполнение запроса.

Ключевые слова¶

Ключевые слова в PostgreSQL являются частью языка SQL и определяют различные операции и функции. Например, SELECT, FROM, WHERE, GROUP BY и ORDER BY — это ключевые слова, которые используются для формирования запросов.

Аргументы¶

Аргументы в PostgreSQL могут быть различными типами данных, такими как числа, строки, даты и т.д. Они используются для передачи информации в запросе, например, для выбора определенных столбцов или фильтрации данных.

Условные выражения¶

Условные выражения в PostgreSQL используются для проверки условий и принятия решений на основе этих условий. Они могут включать операторы сравнения (= для равенства, < для меньше, > для больше и т.д.), логические операторы (AND, OR, NOT), а также функции, такие как LIKE для поиска подстрок.

Операторы¶

Операторы в PostgreSQL используются для выполнения различных операций над данными, таких как сложение, вычитание, умножение и деление чисел, конкатенация строк и т.д.

Функции¶

Функции в PostgreSQL представляют собой блоки кода, которые выполняют определенные задачи. Они могут быть встроенными (предоставляемыми самой СУБД) или пользовательскими (созданными пользователем).

Типы данных¶

PostgreSQL поддерживает широкий спектр типов данных, включая числовые типы (целые числа, вещественные числа), строковые типы (текстовые строки), даты и времени, бинарные данные и многие другие.

Записки и мысли: Оптимизируем PostgreSQL для High-load

Добавил(а) Михаил Губин 4 месяца назад

PostgreSQL — одна из самых популярных систем управления базами данных (СУБД) с открытым исходным кодом. Она обладает высокой производительностью и надёжностью, а также поддерживает транзакции, репликацию и кластеризацию. Однако при работе с высоконагруженными системами (high-load) могут возникать проблемы с производительностью. В этой статье мы рассмотрим несколько способов оптимизации PostgreSQL для работы с high-load.

1. Использование индексов¶

Индексы — это структуры данных, которые позволяют ускорить поиск записей в таблице. Они используются для быстрого доступа к данным по определённому ключу. В PostgreSQL есть несколько типов индексов: B-tree, GiST, GIN и BRIN.

B-tree — это стандартный тип индекса, который используется для поиска по одному или нескольким полям. Он подходит для большинства случаев.

GiST (Generalized Search Tree) — это специальный тип индекса, который используется для поиска по геометрическим данным или для поддержки операций с массивами.

GIN (Generalized Inverted Index) — это ещё один специальный тип индекса, который используется для полнотекстового поиска или для поддержки операций со списками.

BRIN (Block Range Index) — это новый тип индекса, который используется для больших таблиц с большим количеством строк. Он позволяет ускорить операции, которые требуют сканирования большого количества блоков.

Пример создания индекса:

CREATE INDEX idx_name ON table_name (column_name);

2. Оптимизация запросов¶

PostgreSQL имеет мощный оптимизатор запросов, который пытается выбрать наиболее эффективный план выполнения запроса. Однако иногда оптимизатор может ошибаться, и запрос выполняется медленнее, чем мог бы. В таких случаях можно использовать подсказки для оптимизатора.

Пример использования подсказок:

EXPLAIN ANALYZE SELECT * FROM table_name WHERE column_name = 'value';

Этот запрос выведет план выполнения запроса и время его выполнения. Если вы видите, что запрос выполняется медленно, можно попробовать использовать подсказки для оптимизации.

3. Управление памятью¶

PostgreSQL использует оперативную память для хранения временных данных, таких как результаты запросов и промежуточные результаты операций. Если памяти недостаточно, PostgreSQL будет использовать файлы подкачки на диске, что значительно замедлит работу системы. Чтобы избежать этого, можно увеличить размер shared_buffers (общий пул буферов), work_mem (память для операций сортировки и группировки) и maintenance_work_mem (память для выполнения операций обслуживания).

Пример настройки параметров:

ALTER SYSTEM SET shared_buffers TO '1GB';
ALTER SYSTEM SET work_mem TO '1MB';
ALTER SYSTEM SET maintenance_work_mem TO '10MB';

Эти параметры нужно установить в соответствии с вашими потребностями и возможностями системы.

4. Репликация и кластеризация¶

Если ваша система работает с большим объёмом данных и требуется высокая доступность, то можно использовать репликацию и кластеризацию. Репликация позволяет создавать копии базы данных на других серверах, что повышает доступность и отказоустойчивость системы. Кластеризация позволяет распределить нагрузку между несколькими серверами, что увеличивает производительность системы.

Пример конфигурации репликации:

SELECT pg_create_physical_replication_slot('replica_name', true);

Пример конфигурации кластера:

CREATE CLUSTER cluster_name WITH (num_nodes = 3);

Репликация и кластеризация требуют дополнительных настроек и ресурсов, поэтому их следует использовать только в случае необходимости.

Записки и мысли: Поиск и выборка дубликатов с уникальными ID в PostgreSQL

Добавил(а) Михаил Губин 4 месяца назад

PostgreSQL — это система управления базами данных (СУБД), которая предоставляет мощные инструменты для работы с данными. Одним из таких инструментов является возможность поиска и выборки дубликатов с уникальными идентификаторами. В этой статье мы рассмотрим, как использовать эту функцию в PostgreSQL.

Прежде чем начать, давайте определимся с терминологией. Дубликаты — это записи, которые имеют одинаковые значения в определенных столбцах. Уникальные идентификаторы — это столбцы, которые должны быть уникальными для каждой записи.

В PostgreSQL есть несколько способов найти дубликаты с уникальными идентификаторами. Один из них — использование функции SELECT DISTINCT ON. Эта функция позволяет выбрать только одну запись для каждого уникального идентификатора.

Пример использования SELECT DISTINCT ON:

SELECT DISTINCT ON (unique_id) * FROM table_name;

В этом примере unique_id — это уникальный идентификатор, который мы хотим использовать для выбора одной записи из каждой группы дубликатов. * означает, что мы выбираем все столбцы из таблицы table_name.

Если у нас есть таблица users, где user_id — уникальный идентификатор пользователя, и мы хотим выбрать только одного пользователя для каждого user_id, мы можем использовать следующий запрос:

SELECT DISTINCT ON (user_id) * FROM users;

Этот запрос вернет только одну запись для каждого user_id. Если у нас есть несколько записей с одинаковым user_id, то будет выбрана первая запись в порядке сортировки.

Если нам нужно выбрать определенный порядок записей, мы можем добавить условие сортировки после DISTINCT ON:

SELECT DISTINCT ON (user_id) * FROM users ORDER BY last_name, first_name;

В этом случае будут выбраны записи с уникальным user_id, но они будут отсортированы сначала по last_name, затем по first_name.

Еще один способ найти дубликаты с уникальными идентификаторами — использование подзапросов. Мы можем создать подзапрос, который вернет список уникальных идентификаторов, а затем использовать этот список для фильтрации основной таблицы.

Пример использования подзапроса:

WITH unique_ids AS (
    SELECT DISTINCT unique_id FROM table_name
)
SELECT * FROM table_name WHERE unique_id IN (SELECT unique_id FROM unique_ids);

В этом примере WITH unique_ids AS создает временную таблицу unique_ids, которая содержит список уникальных идентификаторов. Затем мы используем IN для фильтрации основной таблицы, чтобы выбрать только те записи, которые имеют уникальные идентификаторы из списка.

Если у нас есть таблица users и мы хотим выбрать только тех пользователей, у которых нет дубликатов, мы можем использовать следующий запрос:

WITH unique_ids AS (
    SELECT DISTINCT user_id FROM users
)
SELECT * FROM users WHERE user_id NOT IN (SELECT user_id FROM unique_ids);

Этот запрос вернет всех пользователей, у которых есть дубликаты.
Важно отметить, что оба этих метода могут быть медленными, особенно если у нас есть большие объемы данных. В таких случаях может быть полезно использовать индексы для ускорения выполнения запросов.

Записки и мысли: Оператор IN в PostgreSQL

Добавил(а) Михаил Губин 4 месяца назад

Оператор IN в PostgreSQL используется для проверки принадлежности значения к списку значений. Он возвращает true, если значение присутствует в списке, и false, если нет.

Синтаксис оператора IN следующий:

SELECT * FROM table_name WHERE column_name IN (value1, value2, ...);

В этом примере column_name - это имя столбца, который мы хотим проверить, а value1, value2, ... - это список значений, на которые мы проверяем.

Пример использования оператора IN:

SELECT * FROM users WHERE id IN (1, 2, 3);

Этот запрос вернет все записи из таблицы users, где id равен 1, 2 или 3.

Оператор IN может использоваться не только для числовых значений, но и для строк, дат и других типов данных. Например:

SELECT * FROM users WHERE email IN ('user1@example.com', 'user2@example.com');

Этот запрос вернет все записи из таблицы users, где email равен user1@example.com или user2@example.com.

Оператор IN также может использоваться для проверки на отсутствие значения в списке. Для этого используется оператор NOT IN:

SELECT * FROM users WHERE id NOT IN (1, 2, 3);

Этот запрос вернет все записи из таблицы users, где id не равен 1, 2 или 3.

Важно отметить, что оператор IN работает только с фиксированным списком значений. Если вам нужно проверить значение на принадлежность к динамическому списку, то лучше использовать подзапросы или другие методы.

Записки и мысли: Функция подстроки PostgreSQL

Добавил(а) Михаил Губин 4 месяца назад

PostgreSQL — это система управления базами данных, которая поддерживает широкий спектр функций для работы с текстовыми данными. Одной из таких функций является функция подстроки, которая позволяет извлекать подстроку из строки.

Синтаксис функции подстроки в PostgreSQL выглядит следующим образом:

SELECT SUBSTRING(source_string FROM start_position FOR length) AS substring_result;

В этом запросе source_string — это исходная строка, из которой мы хотим извлечь подстроку, start_position — это позиция, с которой начинается подстрока, а length — это длина подстроки.

Пример использования функции подстроки:

-- Извлечение подстроки из строки 'Hello World!' начиная с позиции 6 и длиной 5 символов
SELECT SUBSTRING('Hello World!' FROM 6 FOR 5) AS substring_result;

-- Результат будет 'World'

Важно отметить, что позиция начала подстроки в функции подстроки PostgreSQL отсчитывается с нуля, то есть первая позиция в строке имеет индекс 0. Длина подстроки также включает в себя конечную позицию, поэтому если указать длину 5, то будет извлечено 5 символов, включая последний символ.

Если длина подстроки не указана, то функция подстроки извлечет все символы до конца строки. Например:

SELECT SUBSTRING('Hello World!' FROM 6) AS substring_result;

-- Результат будет 'World!'

Также стоит упомянуть, что функция подстроки может быть использована в сочетании с другими функциями PostgreSQL для обработки строк. Например, можно использовать функцию LEFT для извлечения определенного количества символов слева от позиции, а затем функцию подстроки для извлечения остальной части строки:

-- Извлечение 5 символов слева и 5 символов справа от позиции 6
SELECT LEFT('Hello World!' FROM 5) || SUBSTRING('Hello World!' FROM 6 FOR 5) AS substring_result;

-- Результат будет 'Hello Worl'

Это лишь несколько примеров использования функции подстроки. PostgreSQL. Функция подстроки является мощным инструментом для работы с текстовыми данными и может быть использована для решения широкого спектра задач.

Записки и мысли: Известные WAF (Web Application Firewall)

Добавил(а) Михаил Губин 4 месяца назад

Эта таблица представляет собой краткий обзор некоторых из наиболее известных WAF, включая их типы (открытый исходный код, коммерческий, облачный), основные и дополнительные функции. Обратите внимание, что это не полный список всех функций каждого WAF, а лишь примеры основных возможностей.

Название WAF	Тип WAF	Основные функции	Дополнительные функции
ModSecurity	Open Source	SQL Injection, XSS, File Upload, HTTP Splitting, Cross-Site Request Forgery (CSRF)	Rate Limiting, Session Fixation, Session Hijacking, Directory Traversal, Remote File Inclusion, Local File Inclusion, Code Injection, Denial of Service (DoS)
Imperva	Commercial	SQL Injection, Cross-Site Scripting (XSS), XML External Entity (XXE) Attacks, Remote File Inclusion (RFI), Local File Inclusion (LFI), HTTP Response Splitting, Cookie Poisoning, Clickjacking, Server Side Request Forgery (SSRF), Denial of Service (DOS)	Rate limiting, Data loss prevention, Malware detection, Bot mitigation, Real-time threat intelligence, Brute force protection, Web application vulnerability scanning, API security, Compliance reporting, Secure development lifecycle (SDLC) integration
Cloudflare	Cloud-based	SQL Injection, XSS	DDoS mitigation, TLS/SSL encryption, Bot management, WAF rulesets, Caching, Load balancing, DNS
Akamai Kona Site Defender	Cloud-based	OWASP Top 10, Zero Day Exploits, Application-layer DDoS attacks	DDoS Mitigation, Bot Management, Web Application Firewall, SSL/TLS Encryption, Content Delivery Network (CDN), Load Balancing, Web Performance Optimization, Real User Monitoring (RUM), Web Application Vulnerability Scanning, Security Intelligence, Web Application Acceleration
Barracuda Web Application Firewall	Hardware appliance	SQL Injection, Cross-Site Scripting (XSS), LFI, RFI, HTTP Response Splitting, Cookie Poisoning, Clickjacking, SSRF, DoS	Rate limiting, Data loss prevention, Malware detection, Bot mitigation, Real-time threat intelligence, Brute force protection, Web application vulnerability scanning, API security, Compliance reporting, Secure development lifecycle (SDLC) integration
AWS WAF	Cloud-based	SQL Injection, Cross-Site Scripting (XSS), LFI, RFI, HTTP Response Splitting, Cookie Poisoning, Clickjacking, SSRF, DoS	Rate limiting, Data loss prevention, Malware detection, Bot mitigation, Real-time threat intelligence, Brute force protection, Web application vulnerability scanning, API security, Compliance reporting, Secure development lifecycle (SDLC) integration

Записки и мысли: Аппаратная защита от DDoS (All Layers)

Добавил(а) Михаил Губин 4 месяца назад

Эта таблица показывает различные типы атак DDoS, уровни, на которых они могут происходить, и методы аппаратной защиты, которые могут использоваться для предотвращения этих атак.

Тип атаки	Уровень атаки	Методы защиты
ICMP flood	Network layer	Rate limiting, Blackholing, Shunning, BGP Flowspec
UDP flood	Network layer	Blackholing, BGP Flowspec, Source address validation
TCP SYN flood	Transport layer	Rate limiting, Connection limiting, SYN cookies
HTTP flood	Application layer	Web application firewall, Rate limiting
DNS amplification	Application layer	Rate limiting, Response rate limiting, Source address validation, DNS Firewall
NTP amplification	Application layer	Rate limiting, Source address validation

Записки и мысли: Программная защита от DDoS (Layer 4, 5, 6, 7) в Linux

Добавил(а) Михаил Губин 4 месяца назад

Эта таблица представляет собой краткий обзор различных уровней программной защиты от DDoS-атак в операционной системе Linux. Каждый уровень соответствует определенному уровню модели OSI и предлагает различные методы блокировки и фильтрации трафика.

Уровень	Программное обеспечение	Описание
Layer 4	iptables	Блокировка IP-адресов, портов, сетей, масок подсети, маршрутизаторов и т.д.
Layer 5	Netfilter	Расширение iptables для обработки пакетов на уровне протокола TCP/UDP
Layer 6	Fail2ban	Блокировка IP-адресов на основе правил и фильтров, связанных с попытками входа в систему
Layer 7	ModSecurity	Блокировка HTTP-запросов на основе правил безопасности, таких как SQL-инъекции и XSS

(331-340/360)

Экспортировать в Atom

Проект

Общее

Профиль

Михаил Губин @ Gubin Systems

Добавить новость

Новости

Записки и мысли: Кириллические символы (не UTF-8) в PostgreSQL

Записки и мысли: Кириллические символы в запросах и базах PostgreSQL

Использование кириллических символов в запросах¶

Хранение кириллических символов в базах данных¶

Преобразование кодировок¶

Записки и мысли: Лексическая структура PostgreSQL

Основные элементы лексической структуры PostgreSQL¶

Комментарии¶

Ключевые слова¶

Аргументы¶

Условные выражения¶

Операторы¶

Функции¶

Типы данных¶

Записки и мысли: Оптимизируем PostgreSQL для High-load

1. Использование индексов¶

2. Оптимизация запросов¶

3. Управление памятью¶

4. Репликация и кластеризация¶

Записки и мысли: Поиск и выборка дубликатов с уникальными ID в PostgreSQL

Записки и мысли: Оператор IN в PostgreSQL

Записки и мысли: Функция подстроки PostgreSQL

Записки и мысли: Известные WAF (Web Application Firewall)

Записки и мысли: Аппаратная защита от DDoS (All Layers)

Записки и мысли: Программная защита от DDoS (Layer 4, 5, 6, 7) в Linux