您的位置:首页 > 数据库 > > 正文

mysql冷热数据分离方案(MySQL中使用流式查询避免数据OOM)

更多 时间:2022-01-20 00:55:07 类别:数据库 浏览量:1607

mysql冷热数据分离方案

MySQL中使用流式查询避免数据OOM

 

一、前言

程序访问MySQL数据库时,当查询出来的数据量特别大时,数据库驱动把加载到的数据全部加载到内存里,就有可能会导致内存溢出(OOM)。

其实在MySQL数据库中提供了流式查询,允许把符合条件的数据分批一部分一部分地加载到内存中,可以有效避免OOM;本文主要介绍如何使用流式查询并对比普通查询进行性能测试。

 

二、JDBC实现流式查询

使用JDBC的PreparedStatement/StatementsetFetchSize方法设置为Integer.MIN_VALUE或者使用方法Statement.enableStreamingResults()可以实现流式查询,在执行ResultSet.next()方法时,会通过数据库连接一条一条的返回,这样也不会大量占用客户端的内存。

  • ?
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • public int execute(String sql, boolean isStreamQuery) throws SQLException {
  •  Connection conn = null;
  •  PreparedStatement stmt = null;
  •  ResultSet rs = null;
  •  int count = 0;
  •  try {
  •   //获取数据库连接
  •   conn = getConnection();
  •   if (isStreamQuery) {
  •    //设置流式查询参数
  •    stmt = conn.prepareStatement(sql, ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY);
  •    stmt.setFetchSize(Integer.MIN_VALUE);
  •   } else {
  •    //普通查询
  •    stmt = conn.prepareStatement(sql);
  •   }
  •  
  •   //执行查询获取结果
  •   rs = stmt.executeQuery();
  •   //遍历结果
  •   while(rs.next()){
  •    System.out.println(rs.getString(1));
  •    count++;
  •   }
  •  } catch (SQLException e) {
  •   e.printStackTrace();
  •  } finally {
  •   close(stmt, rs, conn);
  •  }
  •  return count;
  • }
  • 「PS」:上面的例子中通过参数isStreamQuery来切换「流式查询」「普通查询」,用于下面做测试对比。

     

    三、性能测试

    创建了一张测试表my_test进行测试,总数据量为27w条,分别使用以下4个测试用例进行测试:

    • 大数据量普通查询(27w条)
    • 大数据量流式查询(27w条)
    • 小数据量普通查询(10条)
    • 小数据量流式查询(10条)

     

    3.1. 测试大数据量普通查询

  • ?
  • 1
  • 2
  • 3
  • 4
  • 5
  • @Test
  • public void testCommonBigData() throws SQLException {
  •  String sql = "select * from my_test";
  •  testExecute(sql, false);
  • }
  • 3.1.1. 查询耗时

    27w 数据量用时 38 秒

    mysql冷热数据分离方案(MySQL中使用流式查询避免数据OOM)

    3.1.2. 内存占用情况

    使用将近 1G 内存

    mysql冷热数据分离方案(MySQL中使用流式查询避免数据OOM)

     

    3.2. 测试大数据量流式查询

  • ?
  • 1
  • 2
  • 3
  • 4
  • 5
  • @Test
  • public void testStreamBigData() throws SQLException {
  •  String sql = "select * from my_test";
  •  testExecute(sql, true);
  • }
  • 3.2.1. 查询耗时

    27w 数据量用时 37 秒

    mysql冷热数据分离方案(MySQL中使用流式查询避免数据OOM)

    3.2.2. 内存占用情况

    由于是分批获取,所以内存在30-270m波动

    mysql冷热数据分离方案(MySQL中使用流式查询避免数据OOM)

     

    3.3. 测试小数据量普通查询

  • ?
  • 1
  • 2
  • 3
  • 4
  • 5
  • @Test
  • public void testCommonSmallData() throws SQLException {
  •  String sql = "select * from my_test limit 100000, 10";
  •  testExecute(sql, false);
  • }
  • 3.3.1. 查询耗时

    10 条数据量用时 1 秒

    mysql冷热数据分离方案(MySQL中使用流式查询避免数据OOM)

     

    3.4. 测试小数据量流式查询

  • ?
  • 1
  • 2
  • 3
  • 4
  • 5
  • @Test
  • public void testStreamSmallData() throws SQLException {
  •  String sql = "select * from my_test limit 100000, 10";
  •  testExecute(sql, true);
  • }
  • 3.4.1. 查询耗时

    10 条数据量用时 1 秒

    mysql冷热数据分离方案(MySQL中使用流式查询避免数据OOM)

     

    四、总结

    MySQL 流式查询对于内存占用方面的优化还是比较明显的,但是对于查询速度的影响较小,主要用于解决大数据量查询时的内存占用多的场景。

    「DEMO地址」:https://github.com/zlt2000/mysql-stream-query

    到此这篇关于MySQL中使用流式查询避免数据OOM的文章就介绍到这了,更多相关MySQL 流式查询内容请搜索开心学习网以前的文章或继续浏览下面的相关文章希望大家以后多多支持开心学习网!

    原文链接:https://segmentfault.com/a/1190000038792484

    您可能感兴趣