Blame - fs/ext4/resize.c - android_kernel_htc_msm8960

blob: 46d9ec8453f2be769df8c33e11c4a2e085512782 [file] [log] [blame]

Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1	/*
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	2	* linux/fs/ext4/resize.c
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	3	*
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	4	* Support for resizing an ext4 filesystem while it is mounted.
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	5	*
				6	* Copyright (C) 2001, 2002 Andreas Dilger <adilger@clusterfs.com>
				7	*
				8	* This could probably be made into a module, because it is not often in use.
				9	*/
				10
				11
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	12	#define EXT4FS_DEBUG
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	13
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	14	#include <linux/errno.h>
				15	#include <linux/slab.h>
				16
Christoph Hellwig	3dcf545	2008-04-29 18:13:32 -0400	[diff] [blame]	17	#include "ext4_jbd2.h"
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	18
Yongqiang Yang	8f82f84	2011-07-26 21:35:44 -0400	[diff] [blame]	19	int ext4_resize_begin(struct super_block *sb)
				20	{
				21	int ret = 0;
				22
				23	if (!capable(CAP_SYS_RESOURCE))
				24	return -EPERM;
				25
Yongqiang Yang	ce723c3	2011-07-26 21:39:09 -0400	[diff] [blame]	26	/*
				27	* We are not allowed to do online-resizing on a filesystem mounted
				28	* with error, because it can destroy the filesystem easily.
				29	*/
				30	if (EXT4_SB(sb)->s_mount_state & EXT4_ERROR_FS) {
				31	ext4_warning(sb, "There are errors in the filesystem, "
				32	"so online resizing is not allowed\n");
				33	return -EPERM;
				34	}
				35
Yongqiang Yang	8f82f84	2011-07-26 21:35:44 -0400	[diff] [blame]	36	if (test_and_set_bit_lock(EXT4_RESIZING, &EXT4_SB(sb)->s_resize_flags))
				37	ret = -EBUSY;
				38
				39	return ret;
				40	}
				41
				42	void ext4_resize_end(struct super_block *sb)
				43	{
				44	clear_bit_unlock(EXT4_RESIZING, &EXT4_SB(sb)->s_resize_flags);
				45	smp_mb__after_clear_bit();
				46	}
				47
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	48	#define outside(b, first, last) ((b) < (first) \|\| (b) >= (last))
				49	#define inside(b, first, last) ((b) >= (first) && (b) < (last))
				50
				51	static int verify_group_input(struct super_block *sb,
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	52	struct ext4_new_group_data *input)
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	53	{
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	54	struct ext4_sb_info *sbi = EXT4_SB(sb);
				55	struct ext4_super_block *es = sbi->s_es;
Laurent Vivier	bd81d8e	2006-10-11 01:21:10 -0700	[diff] [blame]	56	ext4_fsblk_t start = ext4_blocks_count(es);
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	57	ext4_fsblk_t end = start + input->blocks_count;
Avantika Mathur	fd2d429	2008-01-28 23:58:27 -0500	[diff] [blame]	58	ext4_group_t group = input->group;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	59	ext4_fsblk_t itend = input->inode_table + sbi->s_itb_per_group;
				60	unsigned overhead = ext4_bg_has_super(sb, group) ?
				61	(1 + ext4_bg_num_gdb(sb, group) +
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	62	le16_to_cpu(es->s_reserved_gdt_blocks)) : 0;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	63	ext4_fsblk_t metaend = start + overhead;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	64	struct buffer_head *bh = NULL;
Mingming Cao	3a5b2ec	2006-10-11 01:21:05 -0700	[diff] [blame]	65	ext4_grpblk_t free_blocks_count, offset;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	66	int err = -EINVAL;
				67
				68	input->free_blocks_count = free_blocks_count =
				69	input->blocks_count - 2 - overhead - sbi->s_itb_per_group;
				70
				71	if (test_opt(sb, DEBUG))
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	72	printk(KERN_DEBUG "EXT4-fs: adding %s group %u: %u blocks "
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	73	"(%d free, %u reserved)\n",
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	74	ext4_bg_has_super(sb, input->group) ? "normal" :
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	75	"no-super", input->group, input->blocks_count,
				76	free_blocks_count, input->reserved_blocks);
				77
Mingming Cao	3a5b2ec	2006-10-11 01:21:05 -0700	[diff] [blame]	78	ext4_get_group_no_and_offset(sb, start, NULL, &offset);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	79	if (group != sbi->s_groups_count)
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	80	ext4_warning(sb, "Cannot add at group %u (only %u groups)",
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	81	input->group, sbi->s_groups_count);
Mingming Cao	3a5b2ec	2006-10-11 01:21:05 -0700	[diff] [blame]	82	else if (offset != 0)
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	83	ext4_warning(sb, "Last group not full");
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	84	else if (input->reserved_blocks > input->blocks_count / 5)
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	85	ext4_warning(sb, "Reserved blocks too high (%u)",
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	86	input->reserved_blocks);
				87	else if (free_blocks_count < 0)
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	88	ext4_warning(sb, "Bad blocks count %u",
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	89	input->blocks_count);
				90	else if (!(bh = sb_bread(sb, end - 1)))
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	91	ext4_warning(sb, "Cannot read last block (%llu)",
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	92	end - 1);
				93	else if (outside(input->block_bitmap, start, end))
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	94	ext4_warning(sb, "Block bitmap not in group (block %llu)",
Randy Dunlap	1939e49	2006-10-28 10:38:26 -0700	[diff] [blame]	95	(unsigned long long)input->block_bitmap);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	96	else if (outside(input->inode_bitmap, start, end))
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	97	ext4_warning(sb, "Inode bitmap not in group (block %llu)",
Randy Dunlap	1939e49	2006-10-28 10:38:26 -0700	[diff] [blame]	98	(unsigned long long)input->inode_bitmap);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	99	else if (outside(input->inode_table, start, end) \|\|
Theodore Ts'o	2b2d6d0	2008-07-26 16:15:44 -0400	[diff] [blame]	100	outside(itend - 1, start, end))
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	101	ext4_warning(sb, "Inode table not in group (blocks %llu-%llu)",
Randy Dunlap	1939e49	2006-10-28 10:38:26 -0700	[diff] [blame]	102	(unsigned long long)input->inode_table, itend - 1);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	103	else if (input->inode_bitmap == input->block_bitmap)
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	104	ext4_warning(sb, "Block bitmap same as inode bitmap (%llu)",
Randy Dunlap	1939e49	2006-10-28 10:38:26 -0700	[diff] [blame]	105	(unsigned long long)input->block_bitmap);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	106	else if (inside(input->block_bitmap, input->inode_table, itend))
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	107	ext4_warning(sb, "Block bitmap (%llu) in inode table "
				108	"(%llu-%llu)",
Randy Dunlap	1939e49	2006-10-28 10:38:26 -0700	[diff] [blame]	109	(unsigned long long)input->block_bitmap,
				110	(unsigned long long)input->inode_table, itend - 1);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	111	else if (inside(input->inode_bitmap, input->inode_table, itend))
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	112	ext4_warning(sb, "Inode bitmap (%llu) in inode table "
				113	"(%llu-%llu)",
Randy Dunlap	1939e49	2006-10-28 10:38:26 -0700	[diff] [blame]	114	(unsigned long long)input->inode_bitmap,
				115	(unsigned long long)input->inode_table, itend - 1);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	116	else if (inside(input->block_bitmap, start, metaend))
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	117	ext4_warning(sb, "Block bitmap (%llu) in GDT table (%llu-%llu)",
Randy Dunlap	1939e49	2006-10-28 10:38:26 -0700	[diff] [blame]	118	(unsigned long long)input->block_bitmap,
				119	start, metaend - 1);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	120	else if (inside(input->inode_bitmap, start, metaend))
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	121	ext4_warning(sb, "Inode bitmap (%llu) in GDT table (%llu-%llu)",
Randy Dunlap	1939e49	2006-10-28 10:38:26 -0700	[diff] [blame]	122	(unsigned long long)input->inode_bitmap,
				123	start, metaend - 1);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	124	else if (inside(input->inode_table, start, metaend) \|\|
Theodore Ts'o	2b2d6d0	2008-07-26 16:15:44 -0400	[diff] [blame]	125	inside(itend - 1, start, metaend))
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	126	ext4_warning(sb, "Inode table (%llu-%llu) overlaps GDT table "
				127	"(%llu-%llu)",
Randy Dunlap	1939e49	2006-10-28 10:38:26 -0700	[diff] [blame]	128	(unsigned long long)input->inode_table,
				129	itend - 1, start, metaend - 1);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	130	else
				131	err = 0;
				132	brelse(bh);
				133
				134	return err;
				135	}
				136
Yongqiang Yang	28c7bac	2012-01-03 23:22:50 -0500	[diff] [blame]	137	/*
				138	* ext4_new_flex_group_data is used by 64bit-resize interface to add a flex
				139	* group each time.
				140	*/
				141	struct ext4_new_flex_group_data {
				142	struct ext4_new_group_data groups; / new_group_data for groups
				143	in the flex group */
				144	__u16 bg_flags; / block group flags of groups
				145	in @groups */
				146	ext4_group_t count; /* number of groups in @groups
				147	*/
				148	};
				149
				150	/*
				151	* alloc_flex_gd() allocates a ext4_new_flex_group_data with size of
				152	* @flexbg_size.
				153	*
				154	* Returns NULL on failure otherwise address of the allocated structure.
				155	*/
				156	static struct ext4_new_flex_group_data *alloc_flex_gd(unsigned long flexbg_size)
				157	{
				158	struct ext4_new_flex_group_data *flex_gd;
				159
				160	flex_gd = kmalloc(sizeof(*flex_gd), GFP_NOFS);
				161	if (flex_gd == NULL)
				162	goto out3;
				163
Haogang Chen	a9ea448	2012-05-28 14:21:55 -0400	[diff] [blame]	164	if (flexbg_size >= UINT_MAX / sizeof(struct ext4_new_flex_group_data))
				165	goto out2;
Yongqiang Yang	28c7bac	2012-01-03 23:22:50 -0500	[diff] [blame]	166	flex_gd->count = flexbg_size;
				167
				168	flex_gd->groups = kmalloc(sizeof(struct ext4_new_group_data) *
				169	flexbg_size, GFP_NOFS);
				170	if (flex_gd->groups == NULL)
				171	goto out2;
				172
				173	flex_gd->bg_flags = kmalloc(flexbg_size * sizeof(__u16), GFP_NOFS);
				174	if (flex_gd->bg_flags == NULL)
				175	goto out1;
				176
				177	return flex_gd;
				178
				179	out1:
				180	kfree(flex_gd->groups);
				181	out2:
				182	kfree(flex_gd);
				183	out3:
				184	return NULL;
				185	}
				186
				187	static void free_flex_gd(struct ext4_new_flex_group_data *flex_gd)
				188	{
				189	kfree(flex_gd->bg_flags);
				190	kfree(flex_gd->groups);
				191	kfree(flex_gd);
				192	}
				193
Yongqiang Yang	3fbea4b	2012-01-03 23:44:38 -0500	[diff] [blame]	194	/*
				195	* ext4_alloc_group_tables() allocates block bitmaps, inode bitmaps
				196	* and inode tables for a flex group.
				197	*
				198	* This function is used by 64bit-resize. Note that this function allocates
				199	* group tables from the 1st group of groups contained by @flexgd, which may
				200	* be a partial of a flex group.
				201	*
				202	* @sb: super block of fs to which the groups belongs
Yongqiang Yang	2d5a1fb	2012-09-05 01:21:50 -0400	[diff] [blame^]	203	*
				204	* Returns 0 on a successful allocation of the metadata blocks in the
				205	* block group.
Yongqiang Yang	3fbea4b	2012-01-03 23:44:38 -0500	[diff] [blame]	206	*/
Yongqiang Yang	2d5a1fb	2012-09-05 01:21:50 -0400	[diff] [blame^]	207	static int ext4_alloc_group_tables(struct super_block *sb,
Yongqiang Yang	3fbea4b	2012-01-03 23:44:38 -0500	[diff] [blame]	208	struct ext4_new_flex_group_data *flex_gd,
				209	int flexbg_size)
				210	{
				211	struct ext4_new_group_data *group_data = flex_gd->groups;
				212	struct ext4_super_block *es = EXT4_SB(sb)->s_es;
				213	ext4_fsblk_t start_blk;
				214	ext4_fsblk_t last_blk;
				215	ext4_group_t src_group;
				216	ext4_group_t bb_index = 0;
				217	ext4_group_t ib_index = 0;
				218	ext4_group_t it_index = 0;
				219	ext4_group_t group;
				220	ext4_group_t last_group;
				221	unsigned overhead;
				222
				223	BUG_ON(flex_gd->count == 0 \|\| group_data == NULL);
				224
				225	src_group = group_data[0].group;
				226	last_group = src_group + flex_gd->count - 1;
				227
				228	BUG_ON((flexbg_size > 1) && ((src_group & ~(flexbg_size - 1)) !=
				229	(last_group & ~(flexbg_size - 1))));
				230	next_group:
				231	group = group_data[0].group;
Yongqiang Yang	2d5a1fb	2012-09-05 01:21:50 -0400	[diff] [blame^]	232	if (src_group >= group_data[0].group + flex_gd->count)
				233	return -ENOSPC;
Yongqiang Yang	3fbea4b	2012-01-03 23:44:38 -0500	[diff] [blame]	234	start_blk = ext4_group_first_block_no(sb, src_group);
				235	last_blk = start_blk + group_data[src_group - group].blocks_count;
				236
				237	overhead = ext4_bg_has_super(sb, src_group) ?
				238	(1 + ext4_bg_num_gdb(sb, src_group) +
				239	le16_to_cpu(es->s_reserved_gdt_blocks)) : 0;
				240
				241	start_blk += overhead;
				242
Yongqiang Yang	3fbea4b	2012-01-03 23:44:38 -0500	[diff] [blame]	243	/* We collect contiguous blocks as much as possible. */
				244	src_group++;
				245	for (; src_group <= last_group; src_group++)
				246	if (!ext4_bg_has_super(sb, src_group))
				247	last_blk += group_data[src_group - group].blocks_count;
				248	else
				249	break;
				250
				251	/* Allocate block bitmaps */
				252	for (; bb_index < flex_gd->count; bb_index++) {
				253	if (start_blk >= last_blk)
				254	goto next_group;
				255	group_data[bb_index].block_bitmap = start_blk++;
				256	ext4_get_group_no_and_offset(sb, start_blk - 1, &group, NULL);
				257	group -= group_data[0].group;
				258	group_data[group].free_blocks_count--;
				259	if (flexbg_size > 1)
				260	flex_gd->bg_flags[group] &= ~EXT4_BG_BLOCK_UNINIT;
				261	}
				262
				263	/* Allocate inode bitmaps */
				264	for (; ib_index < flex_gd->count; ib_index++) {
				265	if (start_blk >= last_blk)
				266	goto next_group;
				267	group_data[ib_index].inode_bitmap = start_blk++;
				268	ext4_get_group_no_and_offset(sb, start_blk - 1, &group, NULL);
				269	group -= group_data[0].group;
				270	group_data[group].free_blocks_count--;
				271	if (flexbg_size > 1)
				272	flex_gd->bg_flags[group] &= ~EXT4_BG_BLOCK_UNINIT;
				273	}
				274
				275	/* Allocate inode tables */
				276	for (; it_index < flex_gd->count; it_index++) {
				277	if (start_blk + EXT4_SB(sb)->s_itb_per_group > last_blk)
				278	goto next_group;
				279	group_data[it_index].inode_table = start_blk;
				280	ext4_get_group_no_and_offset(sb, start_blk, &group, NULL);
				281	group -= group_data[0].group;
				282	group_data[group].free_blocks_count -=
				283	EXT4_SB(sb)->s_itb_per_group;
				284	if (flexbg_size > 1)
				285	flex_gd->bg_flags[group] &= ~EXT4_BG_BLOCK_UNINIT;
				286
				287	start_blk += EXT4_SB(sb)->s_itb_per_group;
				288	}
				289
				290	if (test_opt(sb, DEBUG)) {
				291	int i;
				292	group = group_data[0].group;
				293
				294	printk(KERN_DEBUG "EXT4-fs: adding a flex group with "
				295	"%d groups, flexbg size is %d:\n", flex_gd->count,
				296	flexbg_size);
				297
				298	for (i = 0; i < flex_gd->count; i++) {
				299	printk(KERN_DEBUG "adding %s group %u: %u "
				300	"blocks (%d free)\n",
				301	ext4_bg_has_super(sb, group + i) ? "normal" :
				302	"no-super", group + i,
				303	group_data[i].blocks_count,
				304	group_data[i].free_blocks_count);
				305	}
				306	}
Yongqiang Yang	2d5a1fb	2012-09-05 01:21:50 -0400	[diff] [blame^]	307	return 0;
Yongqiang Yang	3fbea4b	2012-01-03 23:44:38 -0500	[diff] [blame]	308	}
				309
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	310	static struct buffer_head bclean(handle_t handle, struct super_block *sb,
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	311	ext4_fsblk_t blk)
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	312	{
				313	struct buffer_head *bh;
				314	int err;
				315
				316	bh = sb_getblk(sb, blk);
				317	if (!bh)
				318	return ERR_PTR(-EIO);
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	319	if ((err = ext4_journal_get_write_access(handle, bh))) {
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	320	brelse(bh);
				321	bh = ERR_PTR(err);
				322	} else {
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	323	memset(bh->b_data, 0, sb->s_blocksize);
				324	set_buffer_uptodate(bh);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	325	}
				326
				327	return bh;
				328	}
				329
				330	/*
Eric Sandeen	1490410	2007-10-16 18:38:25 -0400	[diff] [blame]	331	* If we have fewer than thresh credits, extend by EXT4_MAX_TRANS_DATA.
				332	* If that fails, restart the transaction & regain write access for the
				333	* buffer head which is used for block_bitmap modifications.
				334	*/
Yongqiang Yang	6d40bc5	2011-07-26 22:24:41 -0400	[diff] [blame]	335	static int extend_or_restart_transaction(handle_t *handle, int thresh)
Eric Sandeen	1490410	2007-10-16 18:38:25 -0400	[diff] [blame]	336	{
				337	int err;
				338
Frank Mayhar	0390131	2009-01-07 00:06:22 -0500	[diff] [blame]	339	if (ext4_handle_has_enough_credits(handle, thresh))
Eric Sandeen	1490410	2007-10-16 18:38:25 -0400	[diff] [blame]	340	return 0;
				341
				342	err = ext4_journal_extend(handle, EXT4_MAX_TRANS_DATA);
				343	if (err < 0)
				344	return err;
				345	if (err) {
Yongqiang Yang	6d40bc5	2011-07-26 22:24:41 -0400	[diff] [blame]	346	err = ext4_journal_restart(handle, EXT4_MAX_TRANS_DATA);
				347	if (err)
Eric Sandeen	1490410	2007-10-16 18:38:25 -0400	[diff] [blame]	348	return err;
Theodore Ts'o	2b2d6d0	2008-07-26 16:15:44 -0400	[diff] [blame]	349	}
Eric Sandeen	1490410	2007-10-16 18:38:25 -0400	[diff] [blame]	350
				351	return 0;
				352	}
				353
				354	/*
Yongqiang Yang	33afdcc	2012-01-03 23:32:52 -0500	[diff] [blame]	355	* set_flexbg_block_bitmap() mark @count blocks starting from @block used.
				356	*
				357	* Helper function for ext4_setup_new_group_blocks() which set .
				358	*
				359	* @sb: super block
				360	* @handle: journal handle
				361	* @flex_gd: flex group data
				362	*/
				363	static int set_flexbg_block_bitmap(struct super_block sb, handle_t handle,
				364	struct ext4_new_flex_group_data *flex_gd,
				365	ext4_fsblk_t block, ext4_group_t count)
				366	{
				367	ext4_group_t count2;
				368
				369	ext4_debug("mark blocks [%llu/%u] used\n", block, count);
				370	for (count2 = count; count > 0; count -= count2, block += count2) {
				371	ext4_fsblk_t start;
				372	struct buffer_head *bh;
				373	ext4_group_t group;
				374	int err;
				375
				376	ext4_get_group_no_and_offset(sb, block, &group, NULL);
				377	start = ext4_group_first_block_no(sb, group);
				378	group -= flex_gd->groups[0].group;
				379
				380	count2 = sb->s_blocksize * 8 - (block - start);
				381	if (count2 > count)
				382	count2 = count;
				383
				384	if (flex_gd->bg_flags[group] & EXT4_BG_BLOCK_UNINIT) {
				385	BUG_ON(flex_gd->count > 1);
				386	continue;
				387	}
				388
				389	err = extend_or_restart_transaction(handle, 1);
				390	if (err)
				391	return err;
				392
				393	bh = sb_getblk(sb, flex_gd->groups[group].block_bitmap);
				394	if (!bh)
				395	return -EIO;
				396
				397	err = ext4_journal_get_write_access(handle, bh);
				398	if (err)
				399	return err;
				400	ext4_debug("mark block bitmap %#04llx (+%llu/%u)\n", block,
				401	block - start, count2);
				402	ext4_set_bits(bh->b_data, block - start, count2);
				403
				404	err = ext4_handle_dirty_metadata(handle, NULL, bh);
				405	if (unlikely(err))
				406	return err;
				407	brelse(bh);
				408	}
				409
				410	return 0;
				411	}
				412
				413	/*
				414	* Set up the block and inode bitmaps, and the inode table for the new groups.
				415	* This doesn't need to be part of the main transaction, since we are only
				416	* changing blocks outside the actual filesystem. We still do journaling to
				417	* ensure the recovery is correct in case of a failure just after resize.
				418	* If any part of this fails, we simply abort the resize.
				419	*
				420	* setup_new_flex_group_blocks handles a flex group as follow:
				421	* 1. copy super block and GDT, and initialize group tables if necessary.
				422	* In this step, we only set bits in blocks bitmaps for blocks taken by
				423	* super block and GDT.
				424	* 2. allocate group tables in block bitmaps, that is, set bits in block
				425	* bitmap for blocks taken by group tables.
				426	*/
				427	static int setup_new_flex_group_blocks(struct super_block *sb,
				428	struct ext4_new_flex_group_data *flex_gd)
				429	{
				430	int group_table_count[] = {1, 1, EXT4_SB(sb)->s_itb_per_group};
				431	ext4_fsblk_t start;
				432	ext4_fsblk_t block;
				433	struct ext4_sb_info *sbi = EXT4_SB(sb);
				434	struct ext4_super_block *es = sbi->s_es;
				435	struct ext4_new_group_data *group_data = flex_gd->groups;
				436	__u16 *bg_flags = flex_gd->bg_flags;
				437	handle_t *handle;
				438	ext4_group_t group, count;
				439	struct buffer_head *bh = NULL;
				440	int reserved_gdb, i, j, err = 0, err2;
				441
				442	BUG_ON(!flex_gd->count \|\| !group_data \|\|
				443	group_data[0].group != sbi->s_groups_count);
				444
				445	reserved_gdb = le16_to_cpu(es->s_reserved_gdt_blocks);
				446
				447	/* This transaction may be extended/restarted along the way */
				448	handle = ext4_journal_start_sb(sb, EXT4_MAX_TRANS_DATA);
				449	if (IS_ERR(handle))
				450	return PTR_ERR(handle);
				451
				452	group = group_data[0].group;
				453	for (i = 0; i < flex_gd->count; i++, group++) {
				454	unsigned long gdblocks;
				455
				456	gdblocks = ext4_bg_num_gdb(sb, group);
				457	start = ext4_group_first_block_no(sb, group);
				458
				459	/* Copy all of the GDT blocks into the backup in this group */
				460	for (j = 0, block = start + 1; j < gdblocks; j++, block++) {
				461	struct buffer_head *gdb;
				462
				463	ext4_debug("update backup group %#04llx\n", block);
				464	err = extend_or_restart_transaction(handle, 1);
				465	if (err)
				466	goto out;
				467
				468	gdb = sb_getblk(sb, block);
				469	if (!gdb) {
				470	err = -EIO;
				471	goto out;
				472	}
				473
				474	err = ext4_journal_get_write_access(handle, gdb);
				475	if (err) {
				476	brelse(gdb);
				477	goto out;
				478	}
				479	memcpy(gdb->b_data, sbi->s_group_desc[j]->b_data,
				480	gdb->b_size);
				481	set_buffer_uptodate(gdb);
				482
				483	err = ext4_handle_dirty_metadata(handle, NULL, gdb);
				484	if (unlikely(err)) {
				485	brelse(gdb);
				486	goto out;
				487	}
				488	brelse(gdb);
				489	}
				490
				491	/* Zero out all of the reserved backup group descriptor
				492	* table blocks
				493	*/
				494	if (ext4_bg_has_super(sb, group)) {
				495	err = sb_issue_zeroout(sb, gdblocks + start + 1,
				496	reserved_gdb, GFP_NOFS);
				497	if (err)
				498	goto out;
				499	}
				500
				501	/* Initialize group tables of the grop @group */
				502	if (!(bg_flags[i] & EXT4_BG_INODE_ZEROED))
				503	goto handle_bb;
				504
				505	/* Zero out all of the inode table blocks */
				506	block = group_data[i].inode_table;
				507	ext4_debug("clear inode table blocks %#04llx -> %#04lx\n",
				508	block, sbi->s_itb_per_group);
				509	err = sb_issue_zeroout(sb, block, sbi->s_itb_per_group,
				510	GFP_NOFS);
				511	if (err)
				512	goto out;
				513
				514	handle_bb:
				515	if (bg_flags[i] & EXT4_BG_BLOCK_UNINIT)
				516	goto handle_ib;
				517
				518	/* Initialize block bitmap of the @group */
				519	block = group_data[i].block_bitmap;
				520	err = extend_or_restart_transaction(handle, 1);
				521	if (err)
				522	goto out;
				523
				524	bh = bclean(handle, sb, block);
				525	if (IS_ERR(bh)) {
				526	err = PTR_ERR(bh);
				527	goto out;
				528	}
				529	if (ext4_bg_has_super(sb, group)) {
				530	ext4_debug("mark backup superblock %#04llx (+0)\n",
				531	start);
				532	ext4_set_bits(bh->b_data, 0, gdblocks + reserved_gdb +
				533	1);
				534	}
				535	ext4_mark_bitmap_end(group_data[i].blocks_count,
				536	sb->s_blocksize * 8, bh->b_data);
				537	err = ext4_handle_dirty_metadata(handle, NULL, bh);
				538	if (err)
				539	goto out;
				540	brelse(bh);
				541
				542	handle_ib:
				543	if (bg_flags[i] & EXT4_BG_INODE_UNINIT)
				544	continue;
				545
				546	/* Initialize inode bitmap of the @group */
				547	block = group_data[i].inode_bitmap;
				548	err = extend_or_restart_transaction(handle, 1);
				549	if (err)
				550	goto out;
				551	/* Mark unused entries in inode bitmap used */
				552	bh = bclean(handle, sb, block);
				553	if (IS_ERR(bh)) {
				554	err = PTR_ERR(bh);
				555	goto out;
				556	}
				557
				558	ext4_mark_bitmap_end(EXT4_INODES_PER_GROUP(sb),
				559	sb->s_blocksize * 8, bh->b_data);
				560	err = ext4_handle_dirty_metadata(handle, NULL, bh);
				561	if (err)
				562	goto out;
				563	brelse(bh);
				564	}
				565	bh = NULL;
				566
				567	/* Mark group tables in block bitmap */
				568	for (j = 0; j < GROUP_TABLE_COUNT; j++) {
				569	count = group_table_count[j];
				570	start = (&group_data[0].block_bitmap)[j];
				571	block = start;
				572	for (i = 1; i < flex_gd->count; i++) {
				573	block += group_table_count[j];
				574	if (block == (&group_data[i].block_bitmap)[j]) {
				575	count += group_table_count[j];
				576	continue;
				577	}
				578	err = set_flexbg_block_bitmap(sb, handle,
				579	flex_gd, start, count);
				580	if (err)
				581	goto out;
				582	count = group_table_count[j];
				583	start = group_data[i].block_bitmap;
				584	block = start;
				585	}
				586
				587	if (count) {
				588	err = set_flexbg_block_bitmap(sb, handle,
				589	flex_gd, start, count);
				590	if (err)
				591	goto out;
				592	}
				593	}
				594
				595	out:
				596	brelse(bh);
				597	err2 = ext4_journal_stop(handle);
				598	if (err2 && !err)
				599	err = err2;
				600
				601	return err;
				602	}
				603
				604	/*
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	605	* Iterate through the groups which hold BACKUP superblock/GDT copies in an
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	606	* ext4 filesystem. The counters should be initialized to 1, 5, and 7 before
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	607	* calling this for the first time. In a sparse filesystem it will be the
				608	* sequence of powers of 3, 5, and 7: 1, 3, 5, 7, 9, 25, 27, 49, 81, ...
				609	* For a non-sparse filesystem it will be every group: 1, 2, 3, 4, ...
				610	*/
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	611	static unsigned ext4_list_backups(struct super_block sb, unsigned three,
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	612	unsigned five, unsigned seven)
				613	{
				614	unsigned *min = three;
				615	int mult = 3;
				616	unsigned ret;
				617
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	618	if (!EXT4_HAS_RO_COMPAT_FEATURE(sb,
				619	EXT4_FEATURE_RO_COMPAT_SPARSE_SUPER)) {
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	620	ret = *min;
				621	*min += 1;
				622	return ret;
				623	}
				624
				625	if (five < min) {
				626	min = five;
				627	mult = 5;
				628	}
				629	if (seven < min) {
				630	min = seven;
				631	mult = 7;
				632	}
				633
				634	ret = *min;
				635	min = mult;
				636
				637	return ret;
				638	}
				639
				640	/*
				641	* Check that all of the backup GDT blocks are held in the primary GDT block.
				642	* It is assumed that they are stored in group order. Returns the number of
				643	* groups in current filesystem that have BACKUPS, or -ve error code.
				644	*/
				645	static int verify_reserved_gdb(struct super_block *sb,
Yongqiang Yang	c72df9f	2012-01-03 23:43:39 -0500	[diff] [blame]	646	ext4_group_t end,
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	647	struct buffer_head *primary)
				648	{
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	649	const ext4_fsblk_t blk = primary->b_blocknr;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	650	unsigned three = 1;
				651	unsigned five = 5;
				652	unsigned seven = 7;
				653	unsigned grp;
				654	__le32 p = (__le32 )primary->b_data;
				655	int gdbackups = 0;
				656
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	657	while ((grp = ext4_list_backups(sb, &three, &five, &seven)) < end) {
Laurent Vivier	bd81d8e	2006-10-11 01:21:10 -0700	[diff] [blame]	658	if (le32_to_cpu(*p++) !=
				659	grp * EXT4_BLOCKS_PER_GROUP(sb) + blk){
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	660	ext4_warning(sb, "reserved GDT %llu"
Mingming Cao	2ae0210	2006-10-11 01:21:11 -0700	[diff] [blame]	661	" missing grp %d (%llu)",
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	662	blk, grp,
Laurent Vivier	bd81d8e	2006-10-11 01:21:10 -0700	[diff] [blame]	663	grp *
				664	(ext4_fsblk_t)EXT4_BLOCKS_PER_GROUP(sb) +
				665	blk);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	666	return -EINVAL;
				667	}
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	668	if (++gdbackups > EXT4_ADDR_PER_BLOCK(sb))
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	669	return -EFBIG;
				670	}
				671
				672	return gdbackups;
				673	}
				674
				675	/*
				676	* Called when we need to bring a reserved group descriptor table block into
				677	* use from the resize inode. The primary copy of the new GDT block currently
				678	* is an indirect block (under the double indirect block in the resize inode).
				679	* The new backup GDT blocks will be stored as leaf blocks in this indirect
				680	* block, in group order. Even though we know all the block numbers we need,
				681	* we check to ensure that the resize inode has actually reserved these blocks.
				682	*
				683	* Don't need to update the block bitmaps because the blocks are still in use.
				684	*
				685	* We get all of the error cases out of the way, so that we are sure to not
				686	* fail once we start modifying the data on disk, because JBD has no rollback.
				687	*/
				688	static int add_new_gdb(handle_t handle, struct inode inode,
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	689	ext4_group_t group)
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	690	{
				691	struct super_block *sb = inode->i_sb;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	692	struct ext4_super_block *es = EXT4_SB(sb)->s_es;
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	693	unsigned long gdb_num = group / EXT4_DESC_PER_BLOCK(sb);
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	694	ext4_fsblk_t gdblock = EXT4_SB(sb)->s_sbh->b_blocknr + 1 + gdb_num;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	695	struct buffer_head o_group_desc, n_group_desc;
				696	struct buffer_head *dind;
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	697	struct buffer_head *gdb_bh;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	698	int gdbackups;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	699	struct ext4_iloc iloc;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	700	__le32 *data;
				701	int err;
				702
				703	if (test_opt(sb, DEBUG))
				704	printk(KERN_DEBUG
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	705	"EXT4-fs: ext4_add_new_gdb: adding group block %lu\n",
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	706	gdb_num);
				707
Theodore Ts'o	af5bc92	2008-09-08 22:25:24 -0400	[diff] [blame]	708	/*
				709	* If we are not using the primary superblock/GDT copy don't resize,
Theodore Ts'o	2b2d6d0	2008-07-26 16:15:44 -0400	[diff] [blame]	710	* because the user tools have no way of handling this. Probably a
				711	* bad time to do it anyways.
				712	*/
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	713	if (EXT4_SB(sb)->s_sbh->b_blocknr !=
				714	le32_to_cpu(EXT4_SB(sb)->s_es->s_first_data_block)) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	715	ext4_warning(sb, "won't resize using backup superblock at %llu",
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	716	(unsigned long long)EXT4_SB(sb)->s_sbh->b_blocknr);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	717	return -EPERM;
				718	}
				719
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	720	gdb_bh = sb_bread(sb, gdblock);
				721	if (!gdb_bh)
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	722	return -EIO;
				723
Yongqiang Yang	c72df9f	2012-01-03 23:43:39 -0500	[diff] [blame]	724	gdbackups = verify_reserved_gdb(sb, group, gdb_bh);
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	725	if (gdbackups < 0) {
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	726	err = gdbackups;
				727	goto exit_bh;
				728	}
				729
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	730	data = EXT4_I(inode)->i_data + EXT4_DIND_BLOCK;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	731	dind = sb_bread(sb, le32_to_cpu(*data));
				732	if (!dind) {
				733	err = -EIO;
				734	goto exit_bh;
				735	}
				736
				737	data = (__le32 *)dind->b_data;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	738	if (le32_to_cpu(data[gdb_num % EXT4_ADDR_PER_BLOCK(sb)]) != gdblock) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	739	ext4_warning(sb, "new group %u GDT block %llu not reserved",
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	740	group, gdblock);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	741	err = -EINVAL;
				742	goto exit_dind;
				743	}
				744
Theodore Ts'o	b409714	2011-01-10 12:46:59 -0500	[diff] [blame]	745	err = ext4_journal_get_write_access(handle, EXT4_SB(sb)->s_sbh);
				746	if (unlikely(err))
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	747	goto exit_dind;
				748
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	749	err = ext4_journal_get_write_access(handle, gdb_bh);
Theodore Ts'o	b409714	2011-01-10 12:46:59 -0500	[diff] [blame]	750	if (unlikely(err))
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	751	goto exit_sbh;
				752
Theodore Ts'o	b409714	2011-01-10 12:46:59 -0500	[diff] [blame]	753	err = ext4_journal_get_write_access(handle, dind);
				754	if (unlikely(err))
				755	ext4_std_error(sb, err);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	756
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	757	/* ext4_reserve_inode_write() gets a reference on the iloc */
Theodore Ts'o	b409714	2011-01-10 12:46:59 -0500	[diff] [blame]	758	err = ext4_reserve_inode_write(handle, inode, &iloc);
				759	if (unlikely(err))
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	760	goto exit_dindj;
				761
Theodore Ts'o	f18a5f2	2011-08-01 08:45:38 -0400	[diff] [blame]	762	n_group_desc = ext4_kvmalloc((gdb_num + 1) *
				763	sizeof(struct buffer_head *),
				764	GFP_NOFS);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	765	if (!n_group_desc) {
				766	err = -ENOMEM;
Theodore Ts'o	f18a5f2	2011-08-01 08:45:38 -0400	[diff] [blame]	767	ext4_warning(sb, "not enough memory for %lu groups",
				768	gdb_num + 1);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	769	goto exit_inode;
				770	}
				771
				772	/*
				773	* Finally, we have all of the possible failures behind us...
				774	*
				775	* Remove new GDT block from inode double-indirect block and clear out
				776	* the new GDT block for use (which also "frees" the backup GDT blocks
				777	* from the reserved inode). We don't need to change the bitmaps for
				778	* these blocks, because they are marked as in-use from being in the
				779	* reserved inode, and will become GDT blocks (primary and backup).
				780	*/
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	781	data[gdb_num % EXT4_ADDR_PER_BLOCK(sb)] = 0;
Theodore Ts'o	b409714	2011-01-10 12:46:59 -0500	[diff] [blame]	782	err = ext4_handle_dirty_metadata(handle, NULL, dind);
				783	if (unlikely(err)) {
				784	ext4_std_error(sb, err);
				785	goto exit_inode;
				786	}
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	787	inode->i_blocks -= (gdbackups + 1) * sb->s_blocksize >> 9;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	788	ext4_mark_iloc_dirty(handle, inode, &iloc);
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	789	memset(gdb_bh->b_data, 0, sb->s_blocksize);
				790	err = ext4_handle_dirty_metadata(handle, NULL, gdb_bh);
Theodore Ts'o	b409714	2011-01-10 12:46:59 -0500	[diff] [blame]	791	if (unlikely(err)) {
				792	ext4_std_error(sb, err);
				793	goto exit_inode;
				794	}
				795	brelse(dind);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	796
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	797	o_group_desc = EXT4_SB(sb)->s_group_desc;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	798	memcpy(n_group_desc, o_group_desc,
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	799	EXT4_SB(sb)->s_gdb_count * sizeof(struct buffer_head *));
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	800	n_group_desc[gdb_num] = gdb_bh;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	801	EXT4_SB(sb)->s_group_desc = n_group_desc;
				802	EXT4_SB(sb)->s_gdb_count++;
Theodore Ts'o	f18a5f2	2011-08-01 08:45:38 -0400	[diff] [blame]	803	ext4_kvfree(o_group_desc);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	804
Marcin Slusarz	e8546d0	2008-04-17 10:38:59 -0400	[diff] [blame]	805	le16_add_cpu(&es->s_reserved_gdt_blocks, -1);
Theodore Ts'o	b409714	2011-01-10 12:46:59 -0500	[diff] [blame]	806	err = ext4_handle_dirty_metadata(handle, NULL, EXT4_SB(sb)->s_sbh);
				807	if (err)
				808	ext4_std_error(sb, err);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	809
Theodore Ts'o	b409714	2011-01-10 12:46:59 -0500	[diff] [blame]	810	return err;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	811
				812	exit_inode:
Theodore Ts'o	f18a5f2	2011-08-01 08:45:38 -0400	[diff] [blame]	813	ext4_kvfree(n_group_desc);
Amir Goldstein	537a031	2011-03-20 22:57:02 -0400	[diff] [blame]	814	/* ext4_handle_release_buffer(handle, iloc.bh); */
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	815	brelse(iloc.bh);
				816	exit_dindj:
Amir Goldstein	537a031	2011-03-20 22:57:02 -0400	[diff] [blame]	817	/* ext4_handle_release_buffer(handle, dind); */
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	818	exit_sbh:
Amir Goldstein	537a031	2011-03-20 22:57:02 -0400	[diff] [blame]	819	/* ext4_handle_release_buffer(handle, EXT4_SB(sb)->s_sbh); */
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	820	exit_dind:
				821	brelse(dind);
				822	exit_bh:
Yongqiang Yang	2f91971	2011-07-27 21:16:33 -0400	[diff] [blame]	823	brelse(gdb_bh);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	824
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	825	ext4_debug("leaving with error %d\n", err);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	826	return err;
				827	}
				828
				829	/*
				830	* Called when we are adding a new group which has a backup copy of each of
				831	* the GDT blocks (i.e. sparse group) and there are reserved GDT blocks.
				832	* We need to add these reserved backup GDT blocks to the resize inode, so
				833	* that they are kept for future resizing and not allocated to files.
				834	*
				835	* Each reserved backup GDT block will go into a different indirect block.
				836	* The indirect blocks are actually the primary reserved GDT blocks,
				837	* so we know in advance what their block numbers are. We only get the
				838	* double-indirect block to verify it is pointing to the primary reserved
				839	* GDT blocks so we don't overwrite a data block by accident. The reserved
				840	* backup GDT blocks are stored in their reserved primary GDT block.
				841	*/
				842	static int reserve_backup_gdb(handle_t handle, struct inode inode,
Yongqiang Yang	668f4dc	2011-07-27 21:23:13 -0400	[diff] [blame]	843	ext4_group_t group)
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	844	{
				845	struct super_block *sb = inode->i_sb;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	846	int reserved_gdb =le16_to_cpu(EXT4_SB(sb)->s_es->s_reserved_gdt_blocks);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	847	struct buffer_head **primary;
				848	struct buffer_head *dind;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	849	struct ext4_iloc iloc;
				850	ext4_fsblk_t blk;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	851	__le32 data, end;
				852	int gdbackups = 0;
				853	int res, i;
				854	int err;
				855
Josef Bacik	216553c	2008-04-29 22:02:02 -0400	[diff] [blame]	856	primary = kmalloc(reserved_gdb * sizeof(*primary), GFP_NOFS);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	857	if (!primary)
				858	return -ENOMEM;
				859
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	860	data = EXT4_I(inode)->i_data + EXT4_DIND_BLOCK;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	861	dind = sb_bread(sb, le32_to_cpu(*data));
				862	if (!dind) {
				863	err = -EIO;
				864	goto exit_free;
				865	}
				866
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	867	blk = EXT4_SB(sb)->s_sbh->b_blocknr + 1 + EXT4_SB(sb)->s_gdb_count;
Josef Bacik	9446009	2008-06-06 18:05:52 -0400	[diff] [blame]	868	data = (__le32 *)dind->b_data + (EXT4_SB(sb)->s_gdb_count %
				869	EXT4_ADDR_PER_BLOCK(sb));
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	870	end = (__le32 *)dind->b_data + EXT4_ADDR_PER_BLOCK(sb);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	871
				872	/* Get each reserved primary GDT block and verify it holds backups */
				873	for (res = 0; res < reserved_gdb; res++, blk++) {
				874	if (le32_to_cpu(*data) != blk) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	875	ext4_warning(sb, "reserved block %llu"
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	876	" not at offset %ld",
				877	blk,
				878	(long)(data - (__le32 *)dind->b_data));
				879	err = -EINVAL;
				880	goto exit_bh;
				881	}
				882	primary[res] = sb_bread(sb, blk);
				883	if (!primary[res]) {
				884	err = -EIO;
				885	goto exit_bh;
				886	}
Yongqiang Yang	c72df9f	2012-01-03 23:43:39 -0500	[diff] [blame]	887	gdbackups = verify_reserved_gdb(sb, group, primary[res]);
				888	if (gdbackups < 0) {
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	889	brelse(primary[res]);
				890	err = gdbackups;
				891	goto exit_bh;
				892	}
				893	if (++data >= end)
				894	data = (__le32 *)dind->b_data;
				895	}
				896
				897	for (i = 0; i < reserved_gdb; i++) {
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	898	if ((err = ext4_journal_get_write_access(handle, primary[i]))) {
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	899	/*
				900	int j;
				901	for (j = 0; j < i; j++)
Amir Goldstein	537a031	2011-03-20 22:57:02 -0400	[diff] [blame]	902	ext4_handle_release_buffer(handle, primary[j]);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	903	*/
				904	goto exit_bh;
				905	}
				906	}
				907
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	908	if ((err = ext4_reserve_inode_write(handle, inode, &iloc)))
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	909	goto exit_bh;
				910
				911	/*
				912	* Finally we can add each of the reserved backup GDT blocks from
				913	* the new group to its reserved primary GDT block.
				914	*/
Yongqiang Yang	668f4dc	2011-07-27 21:23:13 -0400	[diff] [blame]	915	blk = group * EXT4_BLOCKS_PER_GROUP(sb);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	916	for (i = 0; i < reserved_gdb; i++) {
				917	int err2;
				918	data = (__le32 *)primary[i]->b_data;
				919	/* printk("reserving backup %lu[%u] = %lu\n",
				920	primary[i]->b_blocknr, gdbackups,
				921	blk + primary[i]->b_blocknr); */
				922	data[gdbackups] = cpu_to_le32(blk + primary[i]->b_blocknr);
Frank Mayhar	0390131	2009-01-07 00:06:22 -0500	[diff] [blame]	923	err2 = ext4_handle_dirty_metadata(handle, NULL, primary[i]);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	924	if (!err)
				925	err = err2;
				926	}
				927	inode->i_blocks += reserved_gdb * sb->s_blocksize >> 9;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	928	ext4_mark_iloc_dirty(handle, inode, &iloc);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	929
				930	exit_bh:
				931	while (--res >= 0)
				932	brelse(primary[res]);
				933	brelse(dind);
				934
				935	exit_free:
				936	kfree(primary);
				937
				938	return err;
				939	}
				940
				941	/*
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	942	* Update the backup copies of the ext4 metadata. These don't need to be part
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	943	* of the main resize transaction, because e2fsck will re-write them if there
				944	* is a problem (basically only OOM will cause a problem). However, we
				945	* _should_ update the backups if possible, in case the primary gets trashed
				946	* for some reason and we need to run e2fsck from a backup superblock. The
				947	* important part is that the new block and inode counts are in the backup
				948	* superblocks, and the location of the new group metadata in the GDT backups.
				949	*
Theodore Ts'o	32ed505	2009-04-25 22:53:39 -0400	[diff] [blame]	950	* We do not need take the s_resize_lock for this, because these
				951	* blocks are not otherwise touched by the filesystem code when it is
				952	* mounted. We don't need to worry about last changing from
				953	* sbi->s_groups_count, because the worst that can happen is that we
				954	* do not copy the full number of backups at this time. The resize
				955	* which changed s_groups_count will backup again.
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	956	*/
				957	static void update_backups(struct super_block *sb,
				958	int blk_off, char *data, int size)
				959	{
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	960	struct ext4_sb_info *sbi = EXT4_SB(sb);
Avantika Mathur	fd2d429	2008-01-28 23:58:27 -0500	[diff] [blame]	961	const ext4_group_t last = sbi->s_groups_count;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	962	const int bpg = EXT4_BLOCKS_PER_GROUP(sb);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	963	unsigned three = 1;
				964	unsigned five = 5;
				965	unsigned seven = 7;
Avantika Mathur	fd2d429	2008-01-28 23:58:27 -0500	[diff] [blame]	966	ext4_group_t group;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	967	int rest = sb->s_blocksize - size;
				968	handle_t *handle;
				969	int err = 0, err2;
				970
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	971	handle = ext4_journal_start_sb(sb, EXT4_MAX_TRANS_DATA);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	972	if (IS_ERR(handle)) {
				973	group = 1;
				974	err = PTR_ERR(handle);
				975	goto exit_err;
				976	}
				977
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	978	while ((group = ext4_list_backups(sb, &three, &five, &seven)) < last) {
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	979	struct buffer_head *bh;
				980
				981	/* Out of journal space, and can't get more - abort - so sad */
Frank Mayhar	0390131	2009-01-07 00:06:22 -0500	[diff] [blame]	982	if (ext4_handle_valid(handle) &&
				983	handle->h_buffer_credits == 0 &&
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	984	ext4_journal_extend(handle, EXT4_MAX_TRANS_DATA) &&
				985	(err = ext4_journal_restart(handle, EXT4_MAX_TRANS_DATA)))
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	986	break;
				987
				988	bh = sb_getblk(sb, group * bpg + blk_off);
				989	if (!bh) {
				990	err = -EIO;
				991	break;
				992	}
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	993	ext4_debug("update metadata backup %#04lx\n",
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	994	(unsigned long)bh->b_blocknr);
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	995	if ((err = ext4_journal_get_write_access(handle, bh)))
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	996	break;
				997	lock_buffer(bh);
				998	memcpy(bh->b_data, data, size);
				999	if (rest)
				1000	memset(bh->b_data + size, 0, rest);
				1001	set_buffer_uptodate(bh);
				1002	unlock_buffer(bh);
Theodore Ts'o	b409714	2011-01-10 12:46:59 -0500	[diff] [blame]	1003	err = ext4_handle_dirty_metadata(handle, NULL, bh);
				1004	if (unlikely(err))
				1005	ext4_std_error(sb, err);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1006	brelse(bh);
				1007	}
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1008	if ((err2 = ext4_journal_stop(handle)) && !err)
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1009	err = err2;
				1010
				1011	/*
				1012	* Ugh! Need to have e2fsck write the backup copies. It is too
				1013	* late to revert the resize, we shouldn't fail just because of
				1014	* the backup copies (they are only needed in case of corruption).
				1015	*
				1016	* However, if we got here we have a journal problem too, so we
				1017	* can't really start a transaction to mark the superblock.
				1018	* Chicken out and just set the flag on the hope it will be written
				1019	* to disk, and if not - we will simply wait until next fsck.
				1020	*/
				1021	exit_err:
				1022	if (err) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1023	ext4_warning(sb, "can't update backup for group %u (err %d), "
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1024	"forcing fsck on next reboot", group, err);
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1025	sbi->s_mount_state &= ~EXT4_VALID_FS;
				1026	sbi->s_es->s_state &= cpu_to_le16(~EXT4_VALID_FS);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1027	mark_buffer_dirty(sbi->s_sbh);
				1028	}
				1029	}
				1030
Yongqiang Yang	bb08c1e	2012-01-03 23:20:50 -0500	[diff] [blame]	1031	/*
				1032	* ext4_add_new_descs() adds @count group descriptor of groups
				1033	* starting at @group
				1034	*
				1035	* @handle: journal handle
				1036	* @sb: super block
				1037	* @group: the group no. of the first group desc to be added
				1038	* @resize_inode: the resize inode
				1039	* @count: number of group descriptors to be added
				1040	*/
				1041	static int ext4_add_new_descs(handle_t handle, struct super_block sb,
				1042	ext4_group_t group, struct inode *resize_inode,
				1043	ext4_group_t count)
				1044	{
				1045	struct ext4_sb_info *sbi = EXT4_SB(sb);
				1046	struct ext4_super_block *es = sbi->s_es;
				1047	struct buffer_head *gdb_bh;
				1048	int i, gdb_off, gdb_num, err = 0;
				1049
				1050	for (i = 0; i < count; i++, group++) {
				1051	int reserved_gdb = ext4_bg_has_super(sb, group) ?
				1052	le16_to_cpu(es->s_reserved_gdt_blocks) : 0;
				1053
				1054	gdb_off = group % EXT4_DESC_PER_BLOCK(sb);
				1055	gdb_num = group / EXT4_DESC_PER_BLOCK(sb);
				1056
				1057	/*
				1058	* We will only either add reserved group blocks to a backup group
				1059	* or remove reserved blocks for the first group in a new group block.
				1060	* Doing both would be mean more complex code, and sane people don't
				1061	* use non-sparse filesystems anymore. This is already checked above.
				1062	*/
				1063	if (gdb_off) {
				1064	gdb_bh = sbi->s_group_desc[gdb_num];
				1065	err = ext4_journal_get_write_access(handle, gdb_bh);
				1066
				1067	if (!err && reserved_gdb && ext4_bg_num_gdb(sb, group))
				1068	err = reserve_backup_gdb(handle, resize_inode, group);
				1069	} else
				1070	err = add_new_gdb(handle, resize_inode, group);
				1071	if (err)
				1072	break;
				1073	}
				1074	return err;
				1075	}
				1076
Yongqiang Yang	083f5b2	2012-01-03 23:37:31 -0500	[diff] [blame]	1077	/*
				1078	* ext4_setup_new_descs() will set up the group descriptor descriptors of a flex bg
				1079	*/
				1080	static int ext4_setup_new_descs(handle_t handle, struct super_block sb,
				1081	struct ext4_new_flex_group_data *flex_gd)
				1082	{
				1083	struct ext4_new_group_data *group_data = flex_gd->groups;
				1084	struct ext4_group_desc *gdp;
				1085	struct ext4_sb_info *sbi = EXT4_SB(sb);
				1086	struct buffer_head *gdb_bh;
				1087	ext4_group_t group;
				1088	__u16 *bg_flags = flex_gd->bg_flags;
				1089	int i, gdb_off, gdb_num, err = 0;
				1090
				1091
				1092	for (i = 0; i < flex_gd->count; i++, group_data++, bg_flags++) {
				1093	group = group_data->group;
				1094
				1095	gdb_off = group % EXT4_DESC_PER_BLOCK(sb);
				1096	gdb_num = group / EXT4_DESC_PER_BLOCK(sb);
				1097
				1098	/*
				1099	* get_write_access() has been called on gdb_bh by ext4_add_new_desc().
				1100	*/
				1101	gdb_bh = sbi->s_group_desc[gdb_num];
				1102	/* Update group descriptor block for new group */
				1103	gdp = (struct ext4_group_desc )((char )gdb_bh->b_data +
				1104	gdb_off * EXT4_DESC_SIZE(sb));
				1105
				1106	memset(gdp, 0, EXT4_DESC_SIZE(sb));
				1107	ext4_block_bitmap_set(sb, gdp, group_data->block_bitmap);
				1108	ext4_inode_bitmap_set(sb, gdp, group_data->inode_bitmap);
				1109	ext4_inode_table_set(sb, gdp, group_data->inode_table);
				1110	ext4_free_group_clusters_set(sb, gdp,
				1111	EXT4_B2C(sbi, group_data->free_blocks_count));
				1112	ext4_free_inodes_set(sb, gdp, EXT4_INODES_PER_GROUP(sb));
				1113	gdp->bg_flags = cpu_to_le16(*bg_flags);
				1114	gdp->bg_checksum = ext4_group_desc_csum(sbi, group, gdp);
				1115
				1116	err = ext4_handle_dirty_metadata(handle, NULL, gdb_bh);
				1117	if (unlikely(err)) {
				1118	ext4_std_error(sb, err);
				1119	break;
				1120	}
				1121
				1122	/*
				1123	* We can allocate memory for mb_alloc based on the new group
				1124	* descriptor
				1125	*/
				1126	err = ext4_mb_add_groupinfo(sb, group, gdp);
				1127	if (err)
				1128	break;
				1129	}
				1130	return err;
				1131	}
				1132
Yongqiang Yang	2e10e2f	2012-01-03 23:41:39 -0500	[diff] [blame]	1133	/*
				1134	* ext4_update_super() updates the super block so that the newly added
				1135	* groups can be seen by the filesystem.
				1136	*
				1137	* @sb: super block
				1138	* @flex_gd: new added groups
				1139	*/
				1140	static void ext4_update_super(struct super_block *sb,
				1141	struct ext4_new_flex_group_data *flex_gd)
				1142	{
				1143	ext4_fsblk_t blocks_count = 0;
				1144	ext4_fsblk_t free_blocks = 0;
				1145	ext4_fsblk_t reserved_blocks = 0;
				1146	struct ext4_new_group_data *group_data = flex_gd->groups;
				1147	struct ext4_sb_info *sbi = EXT4_SB(sb);
				1148	struct ext4_super_block *es = sbi->s_es;
Theodore Ts'o	2547139	2012-07-09 16:27:05 -0400	[diff] [blame]	1149	int i, ret;
Yongqiang Yang	2e10e2f	2012-01-03 23:41:39 -0500	[diff] [blame]	1150
				1151	BUG_ON(flex_gd->count == 0 \|\| group_data == NULL);
				1152	/*
				1153	* Make the new blocks and inodes valid next. We do this before
				1154	* increasing the group count so that once the group is enabled,
				1155	* all of its blocks and inodes are already valid.
				1156	*
				1157	* We always allocate group-by-group, then block-by-block or
				1158	* inode-by-inode within a group, so enabling these
				1159	* blocks/inodes before the group is live won't actually let us
				1160	* allocate the new space yet.
				1161	*/
				1162	for (i = 0; i < flex_gd->count; i++) {
				1163	blocks_count += group_data[i].blocks_count;
				1164	free_blocks += group_data[i].free_blocks_count;
				1165	}
				1166
				1167	reserved_blocks = ext4_r_blocks_count(es) * 100;
				1168	do_div(reserved_blocks, ext4_blocks_count(es));
				1169	reserved_blocks *= blocks_count;
				1170	do_div(reserved_blocks, 100);
				1171
				1172	ext4_blocks_count_set(es, ext4_blocks_count(es) + blocks_count);
Darrick J. Wong	636d7e2	2012-03-20 15:46:11 -0400	[diff] [blame]	1173	ext4_free_blocks_count_set(es, ext4_free_blocks_count(es) + free_blocks);
Yongqiang Yang	2e10e2f	2012-01-03 23:41:39 -0500	[diff] [blame]	1174	le32_add_cpu(&es->s_inodes_count, EXT4_INODES_PER_GROUP(sb) *
				1175	flex_gd->count);
Darrick J. Wong	636d7e2	2012-03-20 15:46:11 -0400	[diff] [blame]	1176	le32_add_cpu(&es->s_free_inodes_count, EXT4_INODES_PER_GROUP(sb) *
				1177	flex_gd->count);
Yongqiang Yang	2e10e2f	2012-01-03 23:41:39 -0500	[diff] [blame]	1178
				1179	/*
				1180	* We need to protect s_groups_count against other CPUs seeing
				1181	* inconsistent state in the superblock.
				1182	*
				1183	* The precise rules we use are:
				1184	*
				1185	* * Writers must perform a smp_wmb() after updating all
				1186	* dependent data and before modifying the groups count
				1187	*
				1188	* * Readers must perform an smp_rmb() after reading the groups
				1189	* count and before reading any dependent data.
				1190	*
				1191	* NB. These rules can be relaxed when checking the group count
				1192	* while freeing data, as we can only allocate from a block
				1193	* group after serialising against the group count, and we can
				1194	* only then free after serialising in turn against that
				1195	* allocation.
				1196	*/
				1197	smp_wmb();
				1198
				1199	/* Update the global fs size fields */
				1200	sbi->s_groups_count += flex_gd->count;
				1201
				1202	/* Update the reserved block counts only once the new group is
				1203	* active. */
				1204	ext4_r_blocks_count_set(es, ext4_r_blocks_count(es) +
				1205	reserved_blocks);
				1206
				1207	/* Update the free space counts */
				1208	percpu_counter_add(&sbi->s_freeclusters_counter,
				1209	EXT4_B2C(sbi, free_blocks));
				1210	percpu_counter_add(&sbi->s_freeinodes_counter,
				1211	EXT4_INODES_PER_GROUP(sb) * flex_gd->count);
				1212
				1213	if (EXT4_HAS_INCOMPAT_FEATURE(sb,
				1214	EXT4_FEATURE_INCOMPAT_FLEX_BG) &&
				1215	sbi->s_log_groups_per_flex) {
				1216	ext4_group_t flex_group;
				1217	flex_group = ext4_flex_group(sbi, group_data[0].group);
				1218	atomic_add(EXT4_B2C(sbi, free_blocks),
				1219	&sbi->s_flex_groups[flex_group].free_clusters);
				1220	atomic_add(EXT4_INODES_PER_GROUP(sb) * flex_gd->count,
				1221	&sbi->s_flex_groups[flex_group].free_inodes);
				1222	}
				1223
Theodore Ts'o	2547139	2012-07-09 16:27:05 -0400	[diff] [blame]	1224	/*
				1225	* Update the fs overhead information
				1226	*/
				1227	ext4_calculate_overhead(sb);
				1228
Yongqiang Yang	2e10e2f	2012-01-03 23:41:39 -0500	[diff] [blame]	1229	if (test_opt(sb, DEBUG))
				1230	printk(KERN_DEBUG "EXT4-fs: added group %u:"
				1231	"%llu blocks(%llu free %llu reserved)\n", flex_gd->count,
				1232	blocks_count, free_blocks, reserved_blocks);
				1233	}
				1234
Yongqiang Yang	4bac1f8	2012-01-03 23:44:38 -0500	[diff] [blame]	1235	/* Add a flex group to an fs. Ensure we handle all possible error conditions
				1236	* _before_ we start modifying the filesystem, because we cannot abort the
				1237	* transaction and not have it write the data to disk.
				1238	*/
				1239	static int ext4_flex_group_add(struct super_block *sb,
				1240	struct inode *resize_inode,
				1241	struct ext4_new_flex_group_data *flex_gd)
				1242	{
				1243	struct ext4_sb_info *sbi = EXT4_SB(sb);
				1244	struct ext4_super_block *es = sbi->s_es;
				1245	ext4_fsblk_t o_blocks_count;
				1246	ext4_grpblk_t last;
				1247	ext4_group_t group;
				1248	handle_t *handle;
				1249	unsigned reserved_gdb;
				1250	int err = 0, err2 = 0, credit;
				1251
				1252	BUG_ON(!flex_gd->count \|\| !flex_gd->groups \|\| !flex_gd->bg_flags);
				1253
				1254	reserved_gdb = le16_to_cpu(es->s_reserved_gdt_blocks);
				1255	o_blocks_count = ext4_blocks_count(es);
				1256	ext4_get_group_no_and_offset(sb, o_blocks_count, &group, &last);
				1257	BUG_ON(last);
				1258
				1259	err = setup_new_flex_group_blocks(sb, flex_gd);
				1260	if (err)
				1261	goto exit;
				1262	/*
				1263	* We will always be modifying at least the superblock and GDT
				1264	* block. If we are adding a group past the last current GDT block,
				1265	* we will also modify the inode and the dindirect block. If we
				1266	* are adding a group with superblock/GDT backups we will also
				1267	* modify each of the reserved GDT dindirect blocks.
				1268	*/
				1269	credit = flex_gd->count * 4 + reserved_gdb;
				1270	handle = ext4_journal_start_sb(sb, credit);
				1271	if (IS_ERR(handle)) {
				1272	err = PTR_ERR(handle);
				1273	goto exit;
				1274	}
				1275
				1276	err = ext4_journal_get_write_access(handle, sbi->s_sbh);
				1277	if (err)
				1278	goto exit_journal;
				1279
				1280	group = flex_gd->groups[0].group;
				1281	BUG_ON(group != EXT4_SB(sb)->s_groups_count);
				1282	err = ext4_add_new_descs(handle, sb, group,
				1283	resize_inode, flex_gd->count);
				1284	if (err)
				1285	goto exit_journal;
				1286
				1287	err = ext4_setup_new_descs(handle, sb, flex_gd);
				1288	if (err)
				1289	goto exit_journal;
				1290
				1291	ext4_update_super(sb, flex_gd);
				1292
				1293	err = ext4_handle_dirty_super(handle, sb);
				1294
				1295	exit_journal:
				1296	err2 = ext4_journal_stop(handle);
				1297	if (!err)
				1298	err = err2;
				1299
				1300	if (!err) {
				1301	int i;
				1302	update_backups(sb, sbi->s_sbh->b_blocknr, (char *)es,
				1303	sizeof(struct ext4_super_block));
				1304	for (i = 0; i < flex_gd->count; i++, group++) {
				1305	struct buffer_head *gdb_bh;
				1306	int gdb_num;
				1307	gdb_num = group / EXT4_BLOCKS_PER_GROUP(sb);
				1308	gdb_bh = sbi->s_group_desc[gdb_num];
				1309	update_backups(sb, gdb_bh->b_blocknr, gdb_bh->b_data,
				1310	gdb_bh->b_size);
				1311	}
				1312	}
				1313	exit:
				1314	return err;
				1315	}
				1316
Yongqiang Yang	19c5246	2012-01-04 17:09:44 -0500	[diff] [blame]	1317	static int ext4_setup_next_flex_gd(struct super_block *sb,
				1318	struct ext4_new_flex_group_data *flex_gd,
				1319	ext4_fsblk_t n_blocks_count,
				1320	unsigned long flexbg_size)
				1321	{
				1322	struct ext4_super_block *es = EXT4_SB(sb)->s_es;
				1323	struct ext4_new_group_data *group_data = flex_gd->groups;
				1324	ext4_fsblk_t o_blocks_count;
				1325	ext4_group_t n_group;
				1326	ext4_group_t group;
				1327	ext4_group_t last_group;
				1328	ext4_grpblk_t last;
				1329	ext4_grpblk_t blocks_per_group;
				1330	unsigned long i;
				1331
				1332	blocks_per_group = EXT4_BLOCKS_PER_GROUP(sb);
				1333
				1334	o_blocks_count = ext4_blocks_count(es);
				1335
				1336	if (o_blocks_count == n_blocks_count)
				1337	return 0;
				1338
				1339	ext4_get_group_no_and_offset(sb, o_blocks_count, &group, &last);
				1340	BUG_ON(last);
				1341	ext4_get_group_no_and_offset(sb, n_blocks_count - 1, &n_group, &last);
				1342
				1343	last_group = group \| (flexbg_size - 1);
				1344	if (last_group > n_group)
				1345	last_group = n_group;
				1346
				1347	flex_gd->count = last_group - group + 1;
				1348
				1349	for (i = 0; i < flex_gd->count; i++) {
				1350	int overhead;
				1351
				1352	group_data[i].group = group + i;
				1353	group_data[i].blocks_count = blocks_per_group;
				1354	overhead = ext4_bg_has_super(sb, group + i) ?
				1355	(1 + ext4_bg_num_gdb(sb, group + i) +
				1356	le16_to_cpu(es->s_reserved_gdt_blocks)) : 0;
				1357	group_data[i].free_blocks_count = blocks_per_group - overhead;
				1358	if (EXT4_HAS_RO_COMPAT_FEATURE(sb,
				1359	EXT4_FEATURE_RO_COMPAT_GDT_CSUM))
				1360	flex_gd->bg_flags[i] = EXT4_BG_BLOCK_UNINIT \|
				1361	EXT4_BG_INODE_UNINIT;
				1362	else
				1363	flex_gd->bg_flags[i] = EXT4_BG_INODE_ZEROED;
				1364	}
				1365
				1366	if (last_group == n_group &&
				1367	EXT4_HAS_RO_COMPAT_FEATURE(sb,
				1368	EXT4_FEATURE_RO_COMPAT_GDT_CSUM))
				1369	/* We need to initialize block bitmap of last group. */
				1370	flex_gd->bg_flags[i - 1] &= ~EXT4_BG_BLOCK_UNINIT;
				1371
				1372	if ((last_group == n_group) && (last != blocks_per_group - 1)) {
				1373	group_data[i - 1].blocks_count = last + 1;
				1374	group_data[i - 1].free_blocks_count -= blocks_per_group-
				1375	last - 1;
				1376	}
				1377
				1378	return 1;
				1379	}
				1380
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1381	/* Add group descriptor data to an existing or new group descriptor block.
				1382	* Ensure we handle all possible error conditions _before_ we start modifying
				1383	* the filesystem, because we cannot abort the transaction and not have it
				1384	* write the data to disk.
				1385	*
				1386	* If we are on a GDT block boundary, we need to get the reserved GDT block.
				1387	* Otherwise, we may need to add backup GDT blocks for a sparse group.
				1388	*
				1389	* We only need to hold the superblock lock while we are actually adding
				1390	* in the new group's counts to the superblock. Prior to that we have
				1391	* not really "added" the group at all. We re-check that we are still
				1392	* adding in the last group in case things have changed since verifying.
				1393	*/
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1394	int ext4_group_add(struct super_block sb, struct ext4_new_group_data input)
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1395	{
Yongqiang Yang	61f296c	2012-01-04 17:09:50 -0500	[diff] [blame]	1396	struct ext4_new_flex_group_data flex_gd;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1397	struct ext4_sb_info *sbi = EXT4_SB(sb);
				1398	struct ext4_super_block *es = sbi->s_es;
				1399	int reserved_gdb = ext4_bg_has_super(sb, input->group) ?
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1400	le16_to_cpu(es->s_reserved_gdt_blocks) : 0;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1401	struct inode *inode = NULL;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1402	int gdb_off, gdb_num;
Yongqiang Yang	61f296c	2012-01-04 17:09:50 -0500	[diff] [blame]	1403	int err;
				1404	__u16 bg_flags = 0;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1405
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1406	gdb_num = input->group / EXT4_DESC_PER_BLOCK(sb);
				1407	gdb_off = input->group % EXT4_DESC_PER_BLOCK(sb);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1408
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1409	if (gdb_off == 0 && !EXT4_HAS_RO_COMPAT_FEATURE(sb,
				1410	EXT4_FEATURE_RO_COMPAT_SPARSE_SUPER)) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1411	ext4_warning(sb, "Can't resize non-sparse filesystem further");
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1412	return -EPERM;
				1413	}
				1414
Laurent Vivier	bd81d8e	2006-10-11 01:21:10 -0700	[diff] [blame]	1415	if (ext4_blocks_count(es) + input->blocks_count <
				1416	ext4_blocks_count(es)) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1417	ext4_warning(sb, "blocks_count overflow");
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1418	return -EINVAL;
				1419	}
				1420
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1421	if (le32_to_cpu(es->s_inodes_count) + EXT4_INODES_PER_GROUP(sb) <
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1422	le32_to_cpu(es->s_inodes_count)) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1423	ext4_warning(sb, "inodes_count overflow");
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1424	return -EINVAL;
				1425	}
				1426
				1427	if (reserved_gdb \|\| gdb_off == 0) {
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1428	if (!EXT4_HAS_COMPAT_FEATURE(sb,
Josef Bacik	37609fd	2008-08-19 22:13:41 -0400	[diff] [blame]	1429	EXT4_FEATURE_COMPAT_RESIZE_INODE)
				1430	\|\| !le16_to_cpu(es->s_reserved_gdt_blocks)) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1431	ext4_warning(sb,
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1432	"No reserved GDT blocks, can't resize");
				1433	return -EPERM;
				1434	}
David Howells	1d1fe1e	2008-02-07 00:15:37 -0800	[diff] [blame]	1435	inode = ext4_iget(sb, EXT4_RESIZE_INO);
				1436	if (IS_ERR(inode)) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1437	ext4_warning(sb, "Error opening resize inode");
David Howells	1d1fe1e	2008-02-07 00:15:37 -0800	[diff] [blame]	1438	return PTR_ERR(inode);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1439	}
				1440	}
				1441
Aneesh Kumar K.V	920313a	2009-01-05 21:36:19 -0500	[diff] [blame]	1442
Yongqiang Yang	61f296c	2012-01-04 17:09:50 -0500	[diff] [blame]	1443	err = verify_group_input(sb, input);
Aneesh Kumar K.V	08c3a81	2009-09-09 23:50:17 -0400	[diff] [blame]	1444	if (err)
Yongqiang Yang	61f296c	2012-01-04 17:09:50 -0500	[diff] [blame]	1445	goto out;
Theodore Ts'o	c2ea3fd	2008-10-10 09:40:52 -0400	[diff] [blame]	1446
Yongqiang Yang	61f296c	2012-01-04 17:09:50 -0500	[diff] [blame]	1447	flex_gd.count = 1;
				1448	flex_gd.groups = input;
				1449	flex_gd.bg_flags = &bg_flags;
				1450	err = ext4_flex_group_add(sb, inode, &flex_gd);
				1451	out:
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1452	iput(inode);
				1453	return err;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1454	} /* ext4_group_add */
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1455
Theodore Ts'o	2b2d6d0	2008-07-26 16:15:44 -0400	[diff] [blame]	1456	/*
Yongqiang Yang	18e3143	2012-01-03 23:18:50 -0500	[diff] [blame]	1457	* extend a group without checking assuming that checking has been done.
				1458	*/
				1459	static int ext4_group_extend_no_check(struct super_block *sb,
				1460	ext4_fsblk_t o_blocks_count, ext4_grpblk_t add)
				1461	{
				1462	struct ext4_super_block *es = EXT4_SB(sb)->s_es;
				1463	handle_t *handle;
				1464	int err = 0, err2;
				1465
				1466	/* We will update the superblock, one block bitmap, and
				1467	* one group descriptor via ext4_group_add_blocks().
				1468	*/
				1469	handle = ext4_journal_start_sb(sb, 3);
				1470	if (IS_ERR(handle)) {
				1471	err = PTR_ERR(handle);
				1472	ext4_warning(sb, "error %d on journal start", err);
				1473	return err;
				1474	}
				1475
				1476	err = ext4_journal_get_write_access(handle, EXT4_SB(sb)->s_sbh);
				1477	if (err) {
				1478	ext4_warning(sb, "error %d on journal write access", err);
				1479	goto errout;
				1480	}
				1481
				1482	ext4_blocks_count_set(es, o_blocks_count + add);
Darrick J. Wong	636d7e2	2012-03-20 15:46:11 -0400	[diff] [blame]	1483	ext4_free_blocks_count_set(es, ext4_free_blocks_count(es) + add);
Yongqiang Yang	18e3143	2012-01-03 23:18:50 -0500	[diff] [blame]	1484	ext4_debug("freeing blocks %llu through %llu\n", o_blocks_count,
				1485	o_blocks_count + add);
				1486	/* We add the blocks to the bitmap and set the group need init bit */
				1487	err = ext4_group_add_blocks(handle, sb, o_blocks_count, add);
				1488	if (err)
				1489	goto errout;
				1490	ext4_handle_dirty_super(handle, sb);
				1491	ext4_debug("freed blocks %llu through %llu\n", o_blocks_count,
				1492	o_blocks_count + add);
				1493	errout:
				1494	err2 = ext4_journal_stop(handle);
				1495	if (err2 && !err)
				1496	err = err2;
				1497
				1498	if (!err) {
				1499	if (test_opt(sb, DEBUG))
				1500	printk(KERN_DEBUG "EXT4-fs: extended group to %llu "
				1501	"blocks\n", ext4_blocks_count(es));
				1502	update_backups(sb, EXT4_SB(sb)->s_sbh->b_blocknr, (char *)es,
				1503	sizeof(struct ext4_super_block));
				1504	}
				1505	return err;
				1506	}
				1507
				1508	/*
Theodore Ts'o	2b2d6d0	2008-07-26 16:15:44 -0400	[diff] [blame]	1509	* Extend the filesystem to the new number of blocks specified. This entry
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1510	* point is only used to extend the current filesystem to the end of the last
				1511	* existing group. It can be accessed via ioctl, or by "remount,resize=<size>"
				1512	* for emergencies (because it has no dependencies on reserved blocks).
				1513	*
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1514	* If we _really_ wanted, we could use default values to call ext4_group_add()
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1515	* allow the "remount" trick to work for arbitrary resizing, assuming enough
				1516	* GDT blocks are reserved to grow to the desired size.
				1517	*/
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1518	int ext4_group_extend(struct super_block sb, struct ext4_super_block es,
				1519	ext4_fsblk_t n_blocks_count)
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1520	{
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1521	ext4_fsblk_t o_blocks_count;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1522	ext4_grpblk_t last;
				1523	ext4_grpblk_t add;
Theodore Ts'o	af5bc92	2008-09-08 22:25:24 -0400	[diff] [blame]	1524	struct buffer_head *bh;
Yongqiang Yang	d89651c	2012-01-04 17:09:48 -0500	[diff] [blame]	1525	int err;
Frederic Bohe	5f21b0e	2008-07-11 19:27:31 -0400	[diff] [blame]	1526	ext4_group_t group;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1527
Laurent Vivier	bd81d8e	2006-10-11 01:21:10 -0700	[diff] [blame]	1528	o_blocks_count = ext4_blocks_count(es);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1529
				1530	if (test_opt(sb, DEBUG))
Theodore Ts'o	92b9781	2012-03-19 23:41:49 -0400	[diff] [blame]	1531	ext4_msg(sb, KERN_DEBUG,
				1532	"extending last group from %llu to %llu blocks",
				1533	o_blocks_count, n_blocks_count);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1534
				1535	if (n_blocks_count == 0 \|\| n_blocks_count == o_blocks_count)
				1536	return 0;
				1537
				1538	if (n_blocks_count > (sector_t)(~0ULL) >> (sb->s_blocksize_bits - 9)) {
Theodore Ts'o	92b9781	2012-03-19 23:41:49 -0400	[diff] [blame]	1539	ext4_msg(sb, KERN_ERR,
				1540	"filesystem too large to resize to %llu blocks safely",
				1541	n_blocks_count);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1542	if (sizeof(sector_t) < 8)
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1543	ext4_warning(sb, "CONFIG_LBDAF not enabled");
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1544	return -EINVAL;
				1545	}
				1546
				1547	if (n_blocks_count < o_blocks_count) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1548	ext4_warning(sb, "can't shrink FS - resize aborted");
Yongqiang Yang	8f82f84	2011-07-26 21:35:44 -0400	[diff] [blame]	1549	return -EINVAL;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1550	}
				1551
				1552	/* Handle the remaining blocks in the last group only. */
Frederic Bohe	5f21b0e	2008-07-11 19:27:31 -0400	[diff] [blame]	1553	ext4_get_group_no_and_offset(sb, o_blocks_count, &group, &last);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1554
				1555	if (last == 0) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1556	ext4_warning(sb, "need to use ext2online to resize further");
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1557	return -EPERM;
				1558	}
				1559
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1560	add = EXT4_BLOCKS_PER_GROUP(sb) - last;
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1561
				1562	if (o_blocks_count + add < o_blocks_count) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1563	ext4_warning(sb, "blocks_count overflow");
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1564	return -EINVAL;
				1565	}
				1566
				1567	if (o_blocks_count + add > n_blocks_count)
				1568	add = n_blocks_count - o_blocks_count;
				1569
				1570	if (o_blocks_count + add < n_blocks_count)
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1571	ext4_warning(sb, "will only finish group (%llu blocks, %u new)",
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1572	o_blocks_count + add, add);
				1573
				1574	/* See if the device is actually as big as what was requested */
Theodore Ts'o	2b2d6d0	2008-07-26 16:15:44 -0400	[diff] [blame]	1575	bh = sb_bread(sb, o_blocks_count + add - 1);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1576	if (!bh) {
Eric Sandeen	12062dd	2010-02-15 14:19:27 -0500	[diff] [blame]	1577	ext4_warning(sb, "can't read last block, resize aborted");
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1578	return -ENOSPC;
				1579	}
				1580	brelse(bh);
				1581
Yongqiang Yang	d89651c	2012-01-04 17:09:48 -0500	[diff] [blame]	1582	err = ext4_group_extend_no_check(sb, o_blocks_count, add);
Dave Kleikamp	ac27a0e	2006-10-11 01:20:50 -0700	[diff] [blame]	1583	return err;
Mingming Cao	617ba13	2006-10-11 01:20:53 -0700	[diff] [blame]	1584	} /* ext4_group_extend */
Yongqiang Yang	19c5246	2012-01-04 17:09:44 -0500	[diff] [blame]	1585
				1586	/*
				1587	* ext4_resize_fs() resizes a fs to new size specified by @n_blocks_count
				1588	*
				1589	* @sb: super block of the fs to be resized
				1590	* @n_blocks_count: the number of blocks resides in the resized fs
				1591	*/
				1592	int ext4_resize_fs(struct super_block *sb, ext4_fsblk_t n_blocks_count)
				1593	{
				1594	struct ext4_new_flex_group_data *flex_gd = NULL;
				1595	struct ext4_sb_info *sbi = EXT4_SB(sb);
				1596	struct ext4_super_block *es = sbi->s_es;
				1597	struct buffer_head *bh;
				1598	struct inode *resize_inode;
				1599	ext4_fsblk_t o_blocks_count;
				1600	ext4_group_t o_group;
				1601	ext4_group_t n_group;
Lukas Czerner	a0ade1d	2012-02-20 23:02:06 -0500	[diff] [blame]	1602	ext4_grpblk_t offset, add;
Yongqiang Yang	19c5246	2012-01-04 17:09:44 -0500	[diff] [blame]	1603	unsigned long n_desc_blocks;
				1604	unsigned long o_desc_blocks;
				1605	unsigned long desc_blocks;
				1606	int err = 0, flexbg_size = 1;
				1607
				1608	o_blocks_count = ext4_blocks_count(es);
				1609
				1610	if (test_opt(sb, DEBUG))
Theodore Ts'o	92b9781	2012-03-19 23:41:49 -0400	[diff] [blame]	1611	ext4_msg(sb, KERN_DEBUG, "resizing filesystem from %llu "
				1612	"to %llu blocks", o_blocks_count, n_blocks_count);
Yongqiang Yang	19c5246	2012-01-04 17:09:44 -0500	[diff] [blame]	1613
				1614	if (n_blocks_count < o_blocks_count) {
				1615	/* On-line shrinking not supported */
				1616	ext4_warning(sb, "can't shrink FS - resize aborted");
				1617	return -EINVAL;
				1618	}
				1619
				1620	if (n_blocks_count == o_blocks_count)
				1621	/* Nothing need to do */
				1622	return 0;
				1623
				1624	ext4_get_group_no_and_offset(sb, n_blocks_count - 1, &n_group, &offset);
Lukas Czerner	a0ade1d	2012-02-20 23:02:06 -0500	[diff] [blame]	1625	ext4_get_group_no_and_offset(sb, o_blocks_count - 1, &o_group, &offset);
Yongqiang Yang	19c5246	2012-01-04 17:09:44 -0500	[diff] [blame]	1626
				1627	n_desc_blocks = (n_group + EXT4_DESC_PER_BLOCK(sb)) /
				1628	EXT4_DESC_PER_BLOCK(sb);
				1629	o_desc_blocks = (sbi->s_groups_count + EXT4_DESC_PER_BLOCK(sb) - 1) /
				1630	EXT4_DESC_PER_BLOCK(sb);
				1631	desc_blocks = n_desc_blocks - o_desc_blocks;
				1632
				1633	if (desc_blocks &&
				1634	(!EXT4_HAS_COMPAT_FEATURE(sb, EXT4_FEATURE_COMPAT_RESIZE_INODE) \|\|
				1635	le16_to_cpu(es->s_reserved_gdt_blocks) < desc_blocks)) {
				1636	ext4_warning(sb, "No reserved GDT blocks, can't resize");
				1637	return -EPERM;
				1638	}
				1639
				1640	resize_inode = ext4_iget(sb, EXT4_RESIZE_INO);
				1641	if (IS_ERR(resize_inode)) {
				1642	ext4_warning(sb, "Error opening resize inode");
				1643	return PTR_ERR(resize_inode);
				1644	}
				1645
				1646	/* See if the device is actually as big as what was requested */
				1647	bh = sb_bread(sb, n_blocks_count - 1);
				1648	if (!bh) {
				1649	ext4_warning(sb, "can't read last block, resize aborted");
				1650	return -ENOSPC;
				1651	}
				1652	brelse(bh);
				1653
Lukas Czerner	a0ade1d	2012-02-20 23:02:06 -0500	[diff] [blame]	1654	/* extend the last group */
				1655	if (n_group == o_group)
				1656	add = n_blocks_count - o_blocks_count;
				1657	else
				1658	add = EXT4_BLOCKS_PER_GROUP(sb) - (offset + 1);
				1659	if (add > 0) {
Yongqiang Yang	19c5246	2012-01-04 17:09:44 -0500	[diff] [blame]	1660	err = ext4_group_extend_no_check(sb, o_blocks_count, add);
				1661	if (err)
				1662	goto out;
				1663	}
				1664
				1665	if (EXT4_HAS_INCOMPAT_FEATURE(sb, EXT4_FEATURE_INCOMPAT_FLEX_BG) &&
				1666	es->s_log_groups_per_flex)
				1667	flexbg_size = 1 << es->s_log_groups_per_flex;
				1668
				1669	o_blocks_count = ext4_blocks_count(es);
				1670	if (o_blocks_count == n_blocks_count)
				1671	goto out;
				1672
				1673	flex_gd = alloc_flex_gd(flexbg_size);
				1674	if (flex_gd == NULL) {
				1675	err = -ENOMEM;
				1676	goto out;
				1677	}
				1678
				1679	/* Add flex groups. Note that a regular group is a
				1680	* flex group with 1 group.
				1681	*/
				1682	while (ext4_setup_next_flex_gd(sb, flex_gd, n_blocks_count,
				1683	flexbg_size)) {
Yongqiang Yang	2d5a1fb	2012-09-05 01:21:50 -0400	[diff] [blame^]	1684	if (ext4_alloc_group_tables(sb, flex_gd, flexbg_size) != 0)
				1685	break;
Yongqiang Yang	19c5246	2012-01-04 17:09:44 -0500	[diff] [blame]	1686	err = ext4_flex_group_add(sb, resize_inode, flex_gd);
				1687	if (unlikely(err))
				1688	break;
				1689	}
				1690
				1691	out:
				1692	if (flex_gd)
				1693	free_flex_gd(flex_gd);
				1694
				1695	iput(resize_inode);
				1696	if (test_opt(sb, DEBUG))
Theodore Ts'o	92b9781	2012-03-19 23:41:49 -0400	[diff] [blame]	1697	ext4_msg(sb, KERN_DEBUG, "resized filesystem from %llu "
				1698	"upto %llu blocks", o_blocks_count, n_blocks_count);
Yongqiang Yang	19c5246	2012-01-04 17:09:44 -0500	[diff] [blame]	1699	return err;
				1700	}