h1. Ð‘Ñ‹ÑÑ‚Ñ€Ð¾Ðµ Ð°Ð³Ñ€ÐµÐ³Ð¸Ñ€Ð¾Ð²Ð°Ð½Ð¸Ðµ Ð² PostgreSQL

Ð’Ð¾Ð·ÑŒÐ¼ÐµÐ¼ Ñ‚Ð°ÐºÑƒÑŽ Ñ‚Ð°Ð±Ð»Ð¸Ñ†Ñƒ:

bc[sql]. CREATE table test (a integer, b integer);
INSERT INTO test (SELECT q.a, generate_series(1,10000) AS b FROM (SELECT generate_series(1,1000) AS a) q);

Ð’ Ð½ÐµÐ¹ 10 Ð¼Ð¸Ð»Ð»Ð¸Ð¾Ð½Ð¾Ð² ÑÑ‚Ñ€Ð¾Ðº, Ð½Ð¾ Ð²ÑÐµÐ³Ð¾ 1000 Ð²Ð°Ñ€Ð¸Ð°Ð½Ñ‚Ð¾Ð² Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸Ð¹ ÐºÐ¾Ð»Ð¾Ð½ÐºÐ¸ @a@. Ð˜ Ð¼Ñ‹ Ñ…Ð¾Ñ‚Ð¸Ð¼ Ð²Ñ‹Ð±Ñ€Ð°Ñ‚ÑŒ ÑÑ‚Ñƒ Ñ‚Ñ‹ÑÑÑ‡Ñƒ Ð²Ð°Ñ€Ð¸Ð°Ð½Ñ‚Ð¾Ð² Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸Ð¹ ÐºÐ¾Ð»Ð¾Ð½ÐºÐ¸ @a@.

Ð¡Ð´ÐµÐ»Ð°ÐµÐ¼ Ð¿Ð¾ ÑÑ‚Ð¾Ð¹ ÐºÐ¾Ð»Ð¾Ð½ÐºÐµ Ð¸Ð½Ð´ÐµÐºÑ â€” Ð² Ð½Ð°Ð´ÐµÐ¶Ð´Ðµ, Ñ‡Ñ‚Ð¾ ÑÑ‚Ð¾ Ð½Ð°Ð¼ Ð¿Ð¾Ð¼Ð¾Ð¶ÐµÑ‚:

bc[sql]. CREATE INDEX index_a_on_test ON test (a);

Ð˜ Ð²Ñ‹Ð±Ð¸Ñ€Ð°ÐµÐ¼ Ð´Ð²ÑƒÐ¼Ñ ÑÐ°Ð¼Ñ‹Ð¼Ð¸ Ð¾Ñ‡ÐµÐ²Ð¸Ð´Ð½Ñ‹Ð¼Ð¸ ÑÐ¿Ð¾ÑÐ¾Ð±Ð°Ð¼Ð¸.

bc[sql]. => \timing
Timing is on.
=> SELECT a FROM test GROUP BY a;
Time: 2310.102 ms
=> SELECT DISTINCT a FROM test;
Time: 2354.694 ms

Ð¢Ð°Ðº ÑÐµÐ±Ðµ Ñ€ÐµÐ·ÑƒÐ»ÑŒÑ‚Ð°Ñ‚ Ð´Ð»Ñ Ð²Ñ‹Ð±Ð¾Ñ€ÐºÐ¸ Ñ‚Ñ‹ÑÑÑ‡Ð¸ Ñ‡Ð¸ÑÐµÐ»Ð¾Ðº. ÐŸÐ¾Ñ‡ÐµÐ¼Ñƒ Ñ‚Ð°Ðº Ð´Ð¾Ð»Ð³Ð¾? Ð”Ð° Ð¿Ð¾Ñ‚Ð¾Ð¼Ñƒ Ñ‡Ñ‚Ð¾ ÑÑ‚Ð¸ Ð·Ð°Ð¿Ñ€Ð¾ÑÑ‹ Ð¿Ñ€Ð¾Ñ…Ð¾Ð´ÑÑ‚ Ð¿Ð¾ Ð²ÑÐµÐ¼ 10 Ð¼Ð¸Ð»Ð»Ð¸Ð¾Ð½Ð°Ð¼ ÑÑ‚Ñ€Ð¾Ðº Ð² Ñ‚Ð°Ð±Ð»Ð¸Ñ†Ðµ, Ð° Ð¿Ð¾Ñ‚Ð¾Ð¼ Ð°Ð³Ñ€ÐµÐ³Ð¸Ñ€ÑƒÑŽÑ‚ Ð¸Ñ…. Ð’ÑÐµ Ñ€Ð°Ð²Ð½Ð¾ Ñ‡Ñ‚Ð¾ @| uniq@ Ð² bashâ€™Ðµ Ð½Ð°Ð¿Ð¸ÑÐ°Ñ‚ÑŒ.

bc[sql]. => EXPLAIN SELECT DISTINCT a FROM test;
                              QUERY PLAN                              
----------------------------------------------------------------------
 HashAggregate  (cost=169248.00..169258.00 rows=1000 width=4)
   Group Key: a
   ->  Seq Scan on test  (cost=0.00..144248.00 rows=10000000 width=4) 

ÐÐ°Ð»Ð¸Ñ‡Ð¸Ðµ Ð¸Ð½Ð´ÐµÐºÑÐ° Ð½Ð¸ÐºÐ°Ðº Ð½Ðµ Ð¿Ð¾Ð¼Ð¾Ð³Ð°ÐµÑ‚. ÐÐ¾ ÐµÑÑ‚ÑŒ Ð¾Ð´Ð½Ð° Ñ…Ð¸Ñ‚Ñ€Ð¾ÑÑ‚ÑŒ. Ð•ÑÐ»Ð¸ Ð¼Ñ‹ ÑÐ´ÐµÐ»Ð°ÐµÐ¼ @SELECT a FROM test ORDER BY a LIMIT 1@ â€” Ð±Ð°Ð·Ð° Ð¼Ð¾Ð¼ÐµÐ½Ñ‚Ð°Ð»ÑŒÐ½Ð¾ Ð²Ñ‹Ð´Ð°ÑÑ‚ ÑÐ°Ð¼Ð¾Ðµ Ð¼Ð°Ð»ÐµÐ½ÑŒÐºÐ¾Ðµ Ð·Ð½Ð°Ñ‡ÐµÐ½Ð¸Ðµ @a@ â€” 1 â€” Ð¸ÑÐ¿Ð¾Ð»ÑŒÐ·Ð¾Ð²Ð°Ð² Ð¿Ñ€Ð¸ ÑÑ‚Ð¾Ð¼ Ð¸Ð½Ð´ÐµÐºÑ. Ð”Ð°Ð»ÑŒÑˆÐµ Ð¼Ñ‹ Ð¼Ð¾Ð¶ÐµÐ¼ ÑÐ´ÐµÐ»Ð°Ñ‚ÑŒ @SELECT a FROM test WHERE a > 1 ORDER BY a LIMIT 1@ â€” Ð¸ Ð±Ð°Ð·Ð° ÑÐ½Ð¾Ð²Ð° Ð¼Ð¾Ð¼ÐµÐ½Ñ‚Ð°Ð»ÑŒÐ½Ð¾ Ð¿Ñ€Ñ‹Ð³Ð½ÐµÑ‚ Ð¿Ð¾ Ð¸Ð½Ð´ÐµÐºÑÑƒ Ð¸ Ð²Ñ‹Ð´Ð°ÑÑ‚ 2. ÐŸÑ€Ð°Ð²Ð´Ð°, Ð´ÐµÐ»Ð°Ñ‚ÑŒ Ñ‚Ñ‹ÑÑÑ‡Ñƒ Ð·Ð°Ð¿Ñ€Ð¾ÑÐ¾Ð² Ð² Ð±Ð°Ð·Ñƒ â€” Ñ‚Ð°Ðº ÑÐµÐ±Ðµ Ð¸Ð´ÐµÑ. ÐÐ¾ Ð¼Ñ‹ Ð¼Ð¾Ð¶ÐµÐ¼ ÑÐ´ÐµÐ»Ð°Ñ‚ÑŒ Ñ‚Ð¾ Ð¶Ðµ ÑÐ°Ð¼Ð¾Ðµ, Ð¸ÑÐ¿Ð¾Ð»ÑŒÐ·ÑƒÑ "Ñ€ÐµÐºÑƒÑ€ÑÐ¸Ð²Ð½Ñ‹Ð¹ Ð·Ð°Ð¿Ñ€Ð¾Ñ":https://www.postgresql.org/docs/current/static/queries-with.html:

bc[sql]. => WITH RECURSIVE rec AS (
  SELECT a FROM (
    SELECT a FROM test ORDER BY a LIMIT 1
  ) t1 UNION ALL (
    SELECT (
      SELECT a
      FROM test
      WHERE a > rec.a
      ORDER BY a
      LIMIT 1
    ) AS a
    FROM rec
    WHERE rec.a IS NOT NULL
    LIMIT 1
  )
)
SELECT * FROM rec
Time: 23.440 ms

Ð”Ð°, Ñ Ñ‚Ð¾Ð¶Ðµ Ð½ÐµÐ½Ð°Ð²Ð¸Ð¶Ñƒ Ñ€ÐµÐºÑƒÑ€ÑÐ¸Ð²Ð½Ñ‹Ðµ Ð·Ð°Ð¿Ñ€Ð¾ÑÑ‹. ÐÐ¾ Ð¸Ð½Ð¾Ð³Ð´Ð° Ð±ÐµÐ· Ñ‡ÐµÑ€Ð½Ð¾Ð¹ Ð¼Ð°Ð³Ð¸Ð¸ Ð½Ðµ Ð¾Ð±Ð¾Ð¹Ñ‚Ð¸ÑÑŒ.

ÐœÐ½Ðµ Ð¼Ð¾Ð³ÑƒÑ‚ Ð²Ð¾Ð·Ñ€Ð°Ð·Ð¸Ñ‚ÑŒ, Ñ‡Ñ‚Ð¾ Ð¼Ð¾Ð¸ Ð¿Ñ€Ð¾Ð±Ð»ÐµÐ¼Ñ‹ Ð² ÑÑ‚Ð¾Ð¼ ÑÐ»ÑƒÑ‡Ð°Ðµ Ð¸Ð·-Ð·Ð° Ñ‚Ð¾Ð³Ð¾, Ñ‡Ñ‚Ð¾ Ñƒ Ð¼ÐµÐ½Ñ Ð±Ð°Ð·Ð° Ð´ÐµÐ½Ð¾Ñ€Ð¼Ð°Ð»Ð¸Ð·Ð¾Ð²Ð°Ð½Ð°, Ð¸ Ñ Ð½Ðµ Ð²Ñ‹Ð½ÐµÑ ÐºÐ¾Ð»Ð¾Ð½ÐºÑƒ @a@ Ð² Ð¾Ñ‚Ð´ÐµÐ»ÑŒÐ½ÑƒÑŽ Ñ‚Ð°Ð±Ð»Ð¸Ñ†Ñƒ. Ð¢Ð¾Ð³Ð´Ð° Ñ‚Ð¾ Ð¶Ðµ ÑÐ°Ð¼Ð¾Ðµ Ð¼Ð¾Ð¶Ð½Ð¾ Ð±Ñ‹ Ð±Ñ‹Ð»Ð¾ ÑÐ´ÐµÐ»Ð°Ñ‚ÑŒ Ð¿Ñ€Ð¸ Ð¿Ð¾Ð¼Ð¾Ñ‰Ð¸ @SELECT a FROM a_table@.

ÐÐ¾ Ñ‚Ð°ÐºÐ¾Ð¹ Ñ„Ð¾ÐºÑƒÑ Ð¿Ñ€Ð¾Ð¹Ð´ÐµÑ‚ Ñ‚Ð¾Ð»ÑŒÐºÐ¾ Ñ‚Ð¾Ð³Ð´Ð°, ÐºÐ¾Ð³Ð´Ð° @a@ â€” ÑÑ‚Ð¾ Ð´ÐµÐ¹ÑÑ‚Ð²Ð¸Ñ‚ÐµÐ»ÑŒÐ½Ð¾ Ð¾Ñ‚Ð´ÐµÐ»ÑŒÐ½Ð°Ñ ÑÑƒÑ‰Ð½Ð¾ÑÑ‚ÑŒ, Ð° Ð½Ðµ Ð¿Ñ€Ð¾ÑÑ‚Ð¾ Ð¿Ð¾Ð»Ðµ. ÐŸÑ€ÐµÐ´ÑÑ‚Ð°Ð²Ð¸Ð¼, Ñ‡Ñ‚Ð¾ Ð² Ñ‚Ð°Ð±Ð»Ð¸Ñ†Ðµ @test@ Ð¼Ñ‹ Ñ…Ñ€Ð°Ð½Ð¸Ð»Ð¸ Ð½Ðµ Ñ‡Ð¸ÑÐµÐ»ÐºÐ¸, Ð° ÑÐ¾Ñ‚Ñ€ÑƒÐ´Ð½Ð¸ÐºÐ¾Ð², Ð° ÐºÐ¾Ð»Ð¾Ð½ÐºÐ° @a@ â€” ÑÑ‚Ð¾ Ð¾Ñ€Ð³Ð°Ð½Ð¸Ð·Ð°Ñ†Ð¸Ð¸, Ð² ÐºÐ¾Ñ‚Ð¾Ñ€Ñ‹Ñ… Ð¾Ð½Ð¸ Ñ€Ð°Ð±Ð¾Ñ‚Ð°ÑŽÑ‚. Ð¢Ð¾Ð³Ð´Ð° Ð²ÑÐµ Ñ…Ð¾Ñ€Ð¾ÑˆÐ¾, Ð½Ð¾ Ñ‚Ð¾Ð»ÑŒÐºÐ¾ Ð¿Ð¾Ñ‚Ð¾Ð¼Ñƒ, Ñ‡Ñ‚Ð¾ Ð¾Ñ€Ð³Ð°Ð½Ð¸Ð·Ð°Ñ†Ð¸Ð¸ Ð½Ðµ Ð¸ÑÑ‡ÐµÐ·Ð°ÑŽÑ‚, ÐºÐ¾Ð³Ð´Ð° Ð¼Ñ‹ ÑƒÐ´Ð°Ð»ÑÐµÐ¼ Ð¸Ð· Ð½Ð¸Ñ… ÑÐ¾Ñ‚Ñ€ÑƒÐ´Ð½Ð¸ÐºÐ¾Ð².

Ð”Ñ€ÑƒÐ³Ð¾Ðµ Ð´ÐµÐ»Ð¾ â€” ÐµÑÐ»Ð¸ Ð±Ñ‹ Ð¼Ñ‹ Ñ…Ñ€Ð°Ð½Ð¸Ð»Ð¸ Ð² Ñ‚Ð°Ð±Ð»Ð¸Ñ†Ðµ Ð²ÑÐµ Ñ‚ÐµÑ… Ð¶Ðµ ÑÐ¾Ñ‚Ñ€ÑƒÐ´Ð½Ð¸ÐºÐ¾Ð², Ð½Ð¾ Ð² ÐºÐ¾Ð»Ð¾Ð½ÐºÐµ @a@ Ð±Ñ‹Ð»Ð¸ Ð±Ñ‹ Ð¸Ñ… Ð¸Ð¼ÐµÐ½Ð°. Ð˜ Ð¼Ñ‹ Ð±Ñ‹ Ñ…Ð¾Ñ‚ÐµÐ»Ð¸ ÑƒÐ·Ð½Ð°Ñ‚ÑŒ, ÑÐºÐ¾Ð»ÑŒÐºÐ¾ Ñƒ Ð½Ð°Ñ Ð²ÑÐµÐ³Ð¾ ÑƒÐ½Ð¸ÐºÐ°Ð»ÑŒÐ½Ñ‹Ñ… Ð¸Ð¼ÐµÐ½. Ð’ ÑÑ‚Ð¾Ð¼ ÑÐ»ÑƒÑ‡Ð°Ðµ ÑÐ¾Ð´ÐµÑ€Ð¶Ð°Ñ‚ÑŒ Ð¾Ñ‚Ð´ÐµÐ»ÑŒÐ½ÑƒÑŽ Ñ‚Ð°Ð±Ð»Ð¸Ñ†Ñƒ Ñ Ð¸Ð¼ÐµÐ½Ð°Ð¼Ð¸ â€” ÑÑ‚Ð¾ Ñ‚Ð¾ ÐµÑ‰Ðµ Ñ€Ð°Ð·Ð²Ð»ÐµÑ‡ÐµÐ½Ð¸Ðµ. ÐŸÐ¾Ð¿Ñ€Ð¾Ð±ÑƒÐ¹Ñ‚Ðµ Ð·Ð°Ð±Ð°Ð²Ñ‹ Ñ€Ð°Ð´Ð¸ Ð¿Ñ€Ð¸Ð´ÑƒÐ¼Ð°Ñ‚ÑŒ, ÐºÐ°Ðº Ð¸Ð·Ð±ÐµÐ¶Ð°Ñ‚ÑŒ race conditionâ€™Ð°, ÐºÐ¾Ð³Ð´Ð° Ð² Ð¿Ð°Ñ€Ð°Ð»Ð»ÐµÐ»ÑŒÐ½Ñ‹Ñ… Ñ‚Ñ€Ð°Ð½Ð·Ð°ÐºÑ†Ð¸ÑÑ… ÑƒÐ´Ð°Ð»ÐµÑ‚ÑÑ Ð¿Ð¾ÑÐ»ÐµÐ´Ð½Ð¸Ð¹ ÐžÐ»ÐµÐ³ Ð¸ Ð´Ð¾Ð±Ð°Ð²Ð»ÑÐµÑ‚ÑÑ Ð½Ð¾Ð²Ñ‹Ð¹.

(Ð¾Ñ‚Ð²ÐµÑ‚: Ð¿Ñ€Ð¸ Ð¿Ð¾Ð¼Ð¾Ñ‰Ð¸ ÑƒÐ½Ð¸ÐºÐ°Ð»ÑŒÐ½Ð¾Ð³Ð¾ Ð¸Ð½Ð´ÐµÐºÑÐ° Ð¸ @ON CONFLICT DO NOTHING@)

h2(#see-also). Ð¡Ð¼Ð¾Ñ‚Ñ€Ð¸Ñ‚Ðµ Ñ‚Ð°ÐºÐ¶Ðµ

* "PostgreSQL, Ð¿Ð¾Ð»Ð½Ð¾Ñ‚ÐµÐºÑÑ‚Ð¾Ð²Ñ‹Ð¹ Ð¿Ð¾Ð¸ÑÐº, Ñ€Ð°Ð½Ð¶Ð¸Ñ€Ð¾Ð²Ð°Ð½Ð¸Ðµ, JSON, Ð¸Ð»Ð¸ MongoDB Ð½Ðµ Ð½ÑƒÐ¶Ð½Ð°":/ru/mongodb-Ð½Ðµ-Ð½ÑƒÐ¶Ð½Ð°