Skip to content

Latest commit

 

History

History
executable file
·
147 lines (104 loc) · 11.4 KB

README.md

File metadata and controls

executable file
·
147 lines (104 loc) · 11.4 KB

mackerel

based on jdbc api-4.0

  • Macherel represent for a resource/connection
  • MacherelCan (a macherel container) contains serveral macherel ready to use
  • 适配 mysql、postgresql

MackerelConfig

maxWait

client's max waiting milliseconds for a connection

maxLifetime

a macherel can live after born(default 7 hours) that a slice shorter than mysql's 8 hours(wait_timeout) which auto close connections after being idle so long; see mysql-connection-options

strong liveness guarantee, would not affect in using ones;

什么时候释放常驻连接池的连接?

业务低峰期,比如凌晨到早高峰 24:00:00 ~ 第二天8点 肯定是超过服务端wait_time的 这个时候,拿出来的连接都被服务端给关闭了,都需要重新连,会对业务有影响,也可能对数据库造成瞬时连接压力

所以,需要在数据库服务端wait_time之前,把常驻连接池的连接给renew一下,有个检查线程定期检测

实际上,具有一定规模的公司,微服务的机器数可能是几十甚至几百,就会对数据库的连接数的造成压力,而且mysql会把一些资源缓存在长连接上(sort_buffer_size + read_buffer_size + read_rnd_buffer_size + join_buffer_size + thread_stack + binlog_cache_size),长连接较多,太久没释放对内存也会有压力; 通常dba会把 wait_time设置为 1~2小时,期望快些释放压力;

maxLifetime 还是 maxIdleTime?

前提,都要小于数据库服务端的 wait_time

高并发的服务,一般几分钟甚至一分钟一次ygc,当db连接被清除的时候 肯定已经在老年代了

maxLifeTime

  • 如果是 maxLifetime 概念,即使连接最近还是活跃的,一过maxLifetime就变为gc垃圾,导致old区存在大量待回收的db连接;cms的话 final remark 阶段扫描的引用数量会很多,耗时就会增加,对于高并发的服务(stw比较敏感)影响就比较大
  • 不过 maxLifetime 能更有效的清理db连接资源,减轻数据库的压力

maxIdleTime

  • 常驻连接池的连接(min),只要是活跃的就不会被清理,也不会被数据库服务端断开,对业务服务来说,池子里一直有可用的连接,减少了连接建立的开销
  • 连接可能维持很久,一直占着数据库服务端连接的资源

个人倾向: maxIdleTime

  • 低峰期,保证maxIdle < wati_time < 低峰时段,就能保证进入高峰期的时候,不会说都需要重新建立连接,影响请求rt 和 db瞬时连接压力

连接异常断开如何快速发现?

  • 在数据库升级的时候,短时间内连接可能会全部不可用

  • 也可能是数据库故障、网络抖动等,导致客户端现存连接都不可用了

  • 也可能是有些其他问题导致连接被数据库标记为不可用 这些场景就需要尽快检测到,并且主动剔除这些不可用的连接, 所以就要识别SQLException中带有的连接相关的错误码(比如 08开头的错误码),如果是连接不可用相关的错误码就需要剔除掉这个连接,以免它继续荼毒后续的sql执行

  • postgreSql ErrorCode

  • mysql error code

也就是说在 jdbc api 里边抛出 SQLException 的方法里,都要做数据库错误码的归类和处理

supports

based on jdbc4+, jdbc4 specification

jdbc DriverManager 数据库驱动 driver 注册逻辑

  • jdbc4.0 自动加载 System.getProperty("jdbc.drivers") 中设置的冒号隔开的 driver

  • jdbc4.0 自动加载基于 ServiceLoader SPI 暴露的 Driver

  • Driver 主动调用 DriverManager#registerDriver 注册,通常Driver会在静态代码块中进行注册,所以 Class.forName({driverClassName}) 就能注册相应的 driver;

  • mysql connector 早在5.0.0(2005-12-22) 版本就添加了 META-INF/services/java.sql.Driver 文件支持 service-provicer SPI

  • pg connector 也在Version 42.2.13(2020-06-04) 之后支持了

所以不再需要在代码里显示设置 driverClassName 或者 jdbcUrl 的前缀去匹配对应的 driverClassName 然后 Class.forName 的形式去注册驱动 那么繁琐了, 只要对应的数据库驱动在classpath路径下,就会自动加载注册

默认连接池个数多少?

在索引合理的情况下,并且在数据库引擎的缓冲池 buffer pool 作用下,简单sql的执行其实是毫秒级的,按 10ms算,一个连接1秒能执行 1000/10=100个sql,那么连接池内常驻 10 个连接,能应对 100 * 10 = 1000 qps的请求,足够非高并发服务的数据库请求使用了;

怎么检查并销毁不可用连接

  • 定时检查空闲连接的时候,如果检查失败 则销毁
  • 取出连接时,如果空闲超过一定时间,也进行检查
  • 以上两个检测都需要连接空闲一定时间后才进行检查,但是故障总是无时无刻发生的,如果故障是在检查间隙中发生,比如:由于数据库服务端的原因导致连接关闭、或者网络问题导致底层tcp连接不可用,这时候也要能快速识别到,快速销毁不可用连接才行,这个时候就要在sql执行异常的时候基于特定的code判定连接是否不可用

connection代理类

由于需要在连接关闭的时候,将其归还至连接池中,需要改写 Connection#close() 的行为,所以需要在底层厂商的连接实现基础上封装个代理类;

另外,db连接是具有一些属性设置api的,我们不排除应用在连接使用的时候修改属性状态,所以在连接归还的时候需要重置这些属性到初始状态,避免影响下一个连接使用者的正常使用; Connection 定义了以下属性set api:

  • void setAutoCommit(boolean autoCommit) throws SQLException; // 设置事务自否自动提交,发送命令到服务端(SET autocommit=1、0)

  • void setReadOnly(boolean readOnly) throws SQLException; // 设置只读连接, 发送命令到服务端

  • void setCatalog(String catalog) throws SQLException; // 切换catalog(对于mysql是database), 发送命令到服务端

  • void setTransactionIsolation(int level) throws SQLException; // 切换事务隔离级别, 发送命令到服务端

  • void setSchema(String schema) throws SQLException; // 切换schema (对于mysql无效), 发送命令到服务端

  • void setTypeMap(java.util.Map<String,Class<?>> map) throws SQLException; // 设置自定义类型映射

  • void setHoldability(int holdability) throws SQLException; // 设置resultSet是否在事务提交后还持有游标, mysql的实现是空;

  • void setClientInfo(String name, String value) / void setClientInfo(Properties properties) // 设置客户端信息(ApplicationName、ClientUser、ClientHostname), 不会对服务端sql执行有影响,只在客户端测用来做诊断、调试

  • void setNetworkTimeout(Executor executor, int milliseconds) throws SQLException; // 设置连接级别的网络超时时长,超过这个时间则认为连接已关闭; pg不支持

对sql在当前连接会话上执行有影响的属性:autoCommit、readOnly、catalog、schema、transactionIsolation、networkTimeout, 在获取db连接的这些属性的初始值以及修改的时候,要根据数据库厂商的驱动实现来处理异常; 比如 pg �对networkTimeout的操作是直接抛出异常的,得忽略掉;而在修改 catalog、schema、transactionIsolation的时候,可能由于参数在服务端不合法 这个时候抛出的异常就得处理了

何时检测连接活性

由于网络问题、数据库服务端问题、服务端连接超时等 可能在任何时间发生,所以db物理连接随时都可能变为不可用; 所以需要在讲连接交给用户之前,能进行检测

  1. 定时检测? 间隔一定时间,检查躺在连接池中空闲的连接,如果不可用则剔除
  • druid 和 hikariCP 的定时检查只是为了维护连接数量的稳定;
  • apache GenericObjectPool 则是在evict任务里边做的有效性检查
  1. testWhileIdle? 取出的连接,如果空闲超过一定时间就要检验活性;

testWhileIdle=true时,取出的连接如果空闲多久validateWindow 就要检测活性?

  • hikariCP 默认是500毫秒
  • druid的 timeBetweenEvictionRunsMillis 默认1分钟
  1. 执行sql的时候异常 sql执行抛出异常,可能是因为sql语法有问题、结果集太大导致io timeout了、也可能是连接不可用了; 得根据具体的错误码,确定是连接不可用的异常,则要直接销毁连接,其他异常需要用户自行处理

被动发现,对sql执行有影响

  1. 选择 已经有定时检测了, testWhileIdle 取出检测的时长判断就要小于定时间隔才有意义; 但是定时检查是一分钟一次,testWhileIdle 检测是不是有点频繁? 而且两个检测动作会不会导致竞争?
  • 定时检测: 更为主动,如果连接有问题能更快的剔除并建立新的连接;但是是否过于频繁了?
  • testWhileIdle: 如果网络有问题,全部连接断开,会形成 取出 -> 验活失败 -> 等待新建连接 的现象; 检查次数比定时少很多

个人倾向于 GenericObjectPool 的实现,在定时驱逐任务里边,如果 testWhileIle = true,则再维护连接数稳定的同时检测连接活性

但是~~ 在实际测试的过程中发现: 每隔 validateWindow=60000 都会去校验空闲连接 执行 testWhileIdle 的检查,有两个问题

  • 连接断开是任何时候都可能发生的,要求校验的间隔尽量短,比如1-30秒,把 validateWindow 调小的话,不管是不是业务低峰期,"select 1" 都会特别频繁的发送到服务端,造成一定的压力和浪费,没什么必要
  • 而不调整 validateWindow, 活性校验就不够及时

其实最终的目的是保证交付给用户的连接是可用的,那么在交付前如果连接空闲超过 validateIdleTime(这个可以设置得比 window小很多) 才去校验连接有效性,就能确保校验的时效性

  • 校验的频率和连接使用方有关,当连接获取频繁的时候,连接idle时长 < validateIdleTime 不需要进行 validate 不会影响性能;
  • 在连接池负载低峰期不至于太浪费资源,也不会对db服务端造成太大压力
  • 校验线程和用户获取连接之间也不会存在资源竞争 hikari 和 druid 的选择是对的

如何检测连接是否存活?

jdbc4.x 规范定义了 Connection#isValid(int timeout),具体实现交给各数据库厂商提供的驱动(低版本的驱动可能不支持),通常是发送一个检测sql或者其他机制 如

  • mysql connector里边有会话机制,发送ping来检查连接活性
  • pgsql 则是发送一个空语句(preparedStatement)

所以,用这个作为检测连接活性,能发挥数据库厂商驱动自身的优化

todo

  • mackerel 连接状态判断, 避免连接逃逸
  • statement/preparedStatement/connection sql执行异常错误码判断,如果明确是连接中断的异常错误码 则需要销毁连接
  • jmx 支持,暴露连接池运行时状态