LCOV - code coverage report
Current view: top level - fs/btrfs - extent_io.c (source / functions) Hit Total Coverage
Test: coverage.info Lines: 0 1941 0.0 %
Date: 2014-02-18 Functions: 0 123 0.0 %
Branches: 0 1484 0.0 %

           Branch data     Line data    Source code
       1                 :            : #include <linux/bitops.h>
       2                 :            : #include <linux/slab.h>
       3                 :            : #include <linux/bio.h>
       4                 :            : #include <linux/mm.h>
       5                 :            : #include <linux/pagemap.h>
       6                 :            : #include <linux/page-flags.h>
       7                 :            : #include <linux/spinlock.h>
       8                 :            : #include <linux/blkdev.h>
       9                 :            : #include <linux/swap.h>
      10                 :            : #include <linux/writeback.h>
      11                 :            : #include <linux/pagevec.h>
      12                 :            : #include <linux/prefetch.h>
      13                 :            : #include <linux/cleancache.h>
      14                 :            : #include "extent_io.h"
      15                 :            : #include "extent_map.h"
      16                 :            : #include "ctree.h"
      17                 :            : #include "btrfs_inode.h"
      18                 :            : #include "volumes.h"
      19                 :            : #include "check-integrity.h"
      20                 :            : #include "locking.h"
      21                 :            : #include "rcu-string.h"
      22                 :            : #include "backref.h"
      23                 :            : 
      24                 :            : static struct kmem_cache *extent_state_cache;
      25                 :            : static struct kmem_cache *extent_buffer_cache;
      26                 :            : static struct bio_set *btrfs_bioset;
      27                 :            : 
      28                 :            : #ifdef CONFIG_BTRFS_DEBUG
      29                 :            : static LIST_HEAD(buffers);
      30                 :            : static LIST_HEAD(states);
      31                 :            : 
      32                 :            : static DEFINE_SPINLOCK(leak_lock);
      33                 :            : 
      34                 :            : static inline
      35                 :            : void btrfs_leak_debug_add(struct list_head *new, struct list_head *head)
      36                 :            : {
      37                 :            :         unsigned long flags;
      38                 :            : 
      39                 :            :         spin_lock_irqsave(&leak_lock, flags);
      40                 :            :         list_add(new, head);
      41                 :            :         spin_unlock_irqrestore(&leak_lock, flags);
      42                 :            : }
      43                 :            : 
      44                 :            : static inline
      45                 :            : void btrfs_leak_debug_del(struct list_head *entry)
      46                 :            : {
      47                 :            :         unsigned long flags;
      48                 :            : 
      49                 :            :         spin_lock_irqsave(&leak_lock, flags);
      50                 :            :         list_del(entry);
      51                 :            :         spin_unlock_irqrestore(&leak_lock, flags);
      52                 :            : }
      53                 :            : 
      54                 :            : static inline
      55                 :            : void btrfs_leak_debug_check(void)
      56                 :            : {
      57                 :            :         struct extent_state *state;
      58                 :            :         struct extent_buffer *eb;
      59                 :            : 
      60                 :            :         while (!list_empty(&states)) {
      61                 :            :                 state = list_entry(states.next, struct extent_state, leak_list);
      62                 :            :                 printk(KERN_ERR "btrfs state leak: start %llu end %llu "
      63                 :            :                        "state %lu in tree %p refs %d\n",
      64                 :            :                        state->start, state->end, state->state, state->tree,
      65                 :            :                        atomic_read(&state->refs));
      66                 :            :                 list_del(&state->leak_list);
      67                 :            :                 kmem_cache_free(extent_state_cache, state);
      68                 :            :         }
      69                 :            : 
      70                 :            :         while (!list_empty(&buffers)) {
      71                 :            :                 eb = list_entry(buffers.next, struct extent_buffer, leak_list);
      72                 :            :                 printk(KERN_ERR "btrfs buffer leak start %llu len %lu "
      73                 :            :                        "refs %d\n",
      74                 :            :                        eb->start, eb->len, atomic_read(&eb->refs));
      75                 :            :                 list_del(&eb->leak_list);
      76                 :            :                 kmem_cache_free(extent_buffer_cache, eb);
      77                 :            :         }
      78                 :            : }
      79                 :            : 
      80                 :            : #define btrfs_debug_check_extent_io_range(inode, start, end)            \
      81                 :            :         __btrfs_debug_check_extent_io_range(__func__, (inode), (start), (end))
      82                 :            : static inline void __btrfs_debug_check_extent_io_range(const char *caller,
      83                 :            :                 struct inode *inode, u64 start, u64 end)
      84                 :            : {
      85                 :            :         u64 isize = i_size_read(inode);
      86                 :            : 
      87                 :            :         if (end >= PAGE_SIZE && (end % 2) == 0 && end != isize - 1) {
      88                 :            :                 printk_ratelimited(KERN_DEBUG
      89                 :            :                     "btrfs: %s: ino %llu isize %llu odd range [%llu,%llu]\n",
      90                 :            :                                 caller, btrfs_ino(inode), isize, start, end);
      91                 :            :         }
      92                 :            : }
      93                 :            : #else
      94                 :            : #define btrfs_leak_debug_add(new, head) do {} while (0)
      95                 :            : #define btrfs_leak_debug_del(entry)     do {} while (0)
      96                 :            : #define btrfs_leak_debug_check()        do {} while (0)
      97                 :            : #define btrfs_debug_check_extent_io_range(c, s, e)      do {} while (0)
      98                 :            : #endif
      99                 :            : 
     100                 :            : #define BUFFER_LRU_MAX 64
     101                 :            : 
     102                 :            : struct tree_entry {
     103                 :            :         u64 start;
     104                 :            :         u64 end;
     105                 :            :         struct rb_node rb_node;
     106                 :            : };
     107                 :            : 
     108                 :            : struct extent_page_data {
     109                 :            :         struct bio *bio;
     110                 :            :         struct extent_io_tree *tree;
     111                 :            :         get_extent_t *get_extent;
     112                 :            :         unsigned long bio_flags;
     113                 :            : 
     114                 :            :         /* tells writepage not to lock the state bits for this range
     115                 :            :          * it still does the unlocking
     116                 :            :          */
     117                 :            :         unsigned int extent_locked:1;
     118                 :            : 
     119                 :            :         /* tells the submit_bio code to use a WRITE_SYNC */
     120                 :            :         unsigned int sync_io:1;
     121                 :            : };
     122                 :            : 
     123                 :            : static noinline void flush_write_bio(void *data);
     124                 :            : static inline struct btrfs_fs_info *
     125                 :            : tree_fs_info(struct extent_io_tree *tree)
     126                 :            : {
     127                 :          0 :         return btrfs_sb(tree->mapping->host->i_sb);
     128                 :            : }
     129                 :            : 
     130                 :          0 : int __init extent_io_init(void)
     131                 :            : {
     132                 :          0 :         extent_state_cache = kmem_cache_create("btrfs_extent_state",
     133                 :            :                         sizeof(struct extent_state), 0,
     134                 :            :                         SLAB_RECLAIM_ACCOUNT | SLAB_MEM_SPREAD, NULL);
     135         [ #  # ]:          0 :         if (!extent_state_cache)
     136                 :            :                 return -ENOMEM;
     137                 :            : 
     138                 :          0 :         extent_buffer_cache = kmem_cache_create("btrfs_extent_buffer",
     139                 :            :                         sizeof(struct extent_buffer), 0,
     140                 :            :                         SLAB_RECLAIM_ACCOUNT | SLAB_MEM_SPREAD, NULL);
     141         [ #  # ]:          0 :         if (!extent_buffer_cache)
     142                 :            :                 goto free_state_cache;
     143                 :            : 
     144                 :          0 :         btrfs_bioset = bioset_create(BIO_POOL_SIZE,
     145                 :            :                                      offsetof(struct btrfs_io_bio, bio));
     146         [ #  # ]:          0 :         if (!btrfs_bioset)
     147                 :            :                 goto free_buffer_cache;
     148                 :            : 
     149                 :            :         if (bioset_integrity_create(btrfs_bioset, BIO_POOL_SIZE))
     150                 :            :                 goto free_bioset;
     151                 :            : 
     152                 :            :         return 0;
     153                 :            : 
     154                 :            : free_bioset:
     155                 :            :         bioset_free(btrfs_bioset);
     156                 :            :         btrfs_bioset = NULL;
     157                 :            : 
     158                 :            : free_buffer_cache:
     159                 :          0 :         kmem_cache_destroy(extent_buffer_cache);
     160                 :          0 :         extent_buffer_cache = NULL;
     161                 :            : 
     162                 :            : free_state_cache:
     163                 :          0 :         kmem_cache_destroy(extent_state_cache);
     164                 :          0 :         extent_state_cache = NULL;
     165                 :          0 :         return -ENOMEM;
     166                 :            : }
     167                 :            : 
     168                 :          0 : void extent_io_exit(void)
     169                 :            : {
     170                 :            :         btrfs_leak_debug_check();
     171                 :            : 
     172                 :            :         /*
     173                 :            :          * Make sure all delayed rcu free are flushed before we
     174                 :            :          * destroy caches.
     175                 :            :          */
     176                 :          0 :         rcu_barrier();
     177         [ #  # ]:          0 :         if (extent_state_cache)
     178                 :          0 :                 kmem_cache_destroy(extent_state_cache);
     179         [ #  # ]:          0 :         if (extent_buffer_cache)
     180                 :          0 :                 kmem_cache_destroy(extent_buffer_cache);
     181         [ #  # ]:          0 :         if (btrfs_bioset)
     182                 :          0 :                 bioset_free(btrfs_bioset);
     183                 :          0 : }
     184                 :            : 
     185                 :          0 : void extent_io_tree_init(struct extent_io_tree *tree,
     186                 :            :                          struct address_space *mapping)
     187                 :            : {
     188                 :          0 :         tree->state = RB_ROOT;
     189                 :          0 :         INIT_RADIX_TREE(&tree->buffer, GFP_ATOMIC);
     190                 :          0 :         tree->ops = NULL;
     191                 :          0 :         tree->dirty_bytes = 0;
     192                 :          0 :         spin_lock_init(&tree->lock);
     193                 :          0 :         spin_lock_init(&tree->buffer_lock);
     194                 :          0 :         tree->mapping = mapping;
     195                 :          0 : }
     196                 :            : 
     197                 :          0 : static struct extent_state *alloc_extent_state(gfp_t mask)
     198                 :            : {
     199                 :            :         struct extent_state *state;
     200                 :            : 
     201                 :          0 :         state = kmem_cache_alloc(extent_state_cache, mask);
     202         [ #  # ]:          0 :         if (!state)
     203                 :            :                 return state;
     204                 :          0 :         state->state = 0;
     205                 :          0 :         state->private = 0;
     206                 :          0 :         state->tree = NULL;
     207                 :            :         btrfs_leak_debug_add(&state->leak_list, &states);
     208                 :          0 :         atomic_set(&state->refs, 1);
     209                 :          0 :         init_waitqueue_head(&state->wq);
     210                 :          0 :         trace_alloc_extent_state(state, mask, _RET_IP_);
     211                 :            :         return state;
     212                 :            : }
     213                 :            : 
     214                 :          0 : void free_extent_state(struct extent_state *state)
     215                 :            : {
     216         [ #  # ]:          0 :         if (!state)
     217                 :          0 :                 return;
     218         [ #  # ]:          0 :         if (atomic_dec_and_test(&state->refs)) {
     219         [ #  # ]:          0 :                 WARN_ON(state->tree);
     220                 :            :                 btrfs_leak_debug_del(&state->leak_list);
     221                 :          0 :                 trace_free_extent_state(state, _RET_IP_);
     222                 :          0 :                 kmem_cache_free(extent_state_cache, state);
     223                 :            :         }
     224                 :            : }
     225                 :            : 
     226                 :          0 : static struct rb_node *tree_insert(struct rb_root *root, u64 offset,
     227                 :            :                                    struct rb_node *node)
     228                 :            : {
     229                 :          0 :         struct rb_node **p = &root->rb_node;
     230                 :            :         struct rb_node *parent = NULL;
     231                 :            :         struct tree_entry *entry;
     232                 :            : 
     233         [ #  # ]:          0 :         while (*p) {
     234                 :            :                 parent = *p;
     235                 :            :                 entry = rb_entry(parent, struct tree_entry, rb_node);
     236                 :            : 
     237         [ #  # ]:          0 :                 if (offset < entry->start)
     238                 :          0 :                         p = &(*p)->rb_left;
     239         [ #  # ]:          0 :                 else if (offset > entry->end)
     240                 :          0 :                         p = &(*p)->rb_right;
     241                 :            :                 else
     242                 :            :                         return parent;
     243                 :            :         }
     244                 :            : 
     245                 :            :         rb_link_node(node, parent, p);
     246                 :          0 :         rb_insert_color(node, root);
     247                 :          0 :         return NULL;
     248                 :            : }
     249                 :            : 
     250                 :          0 : static struct rb_node *__etree_search(struct extent_io_tree *tree, u64 offset,
     251                 :            :                                      struct rb_node **prev_ret,
     252                 :            :                                      struct rb_node **next_ret)
     253                 :            : {
     254                 :            :         struct rb_root *root = &tree->state;
     255                 :          0 :         struct rb_node *n = root->rb_node;
     256                 :            :         struct rb_node *prev = NULL;
     257                 :            :         struct rb_node *orig_prev = NULL;
     258                 :            :         struct tree_entry *entry;
     259                 :            :         struct tree_entry *prev_entry = NULL;
     260                 :            : 
     261         [ #  # ]:          0 :         while (n) {
     262                 :          0 :                 entry = rb_entry(n, struct tree_entry, rb_node);
     263                 :            :                 prev = n;
     264                 :            :                 prev_entry = entry;
     265                 :            : 
     266         [ #  # ]:          0 :                 if (offset < entry->start)
     267                 :          0 :                         n = n->rb_left;
     268         [ #  # ]:          0 :                 else if (offset > entry->end)
     269                 :          0 :                         n = n->rb_right;
     270                 :            :                 else
     271                 :            :                         return n;
     272                 :            :         }
     273                 :            : 
     274         [ #  # ]:          0 :         if (prev_ret) {
     275                 :            :                 orig_prev = prev;
     276 [ #  # ][ #  # ]:          0 :                 while (prev && offset > prev_entry->end) {
     277                 :          0 :                         prev = rb_next(prev);
     278                 :          0 :                         prev_entry = rb_entry(prev, struct tree_entry, rb_node);
     279                 :            :                 }
     280                 :          0 :                 *prev_ret = prev;
     281                 :            :                 prev = orig_prev;
     282                 :            :         }
     283                 :            : 
     284         [ #  # ]:          0 :         if (next_ret) {
     285                 :          0 :                 prev_entry = rb_entry(prev, struct tree_entry, rb_node);
     286 [ #  # ][ #  # ]:          0 :                 while (prev && offset < prev_entry->start) {
     287                 :          0 :                         prev = rb_prev(prev);
     288                 :          0 :                         prev_entry = rb_entry(prev, struct tree_entry, rb_node);
     289                 :            :                 }
     290                 :          0 :                 *next_ret = prev;
     291                 :            :         }
     292                 :            :         return NULL;
     293                 :            : }
     294                 :            : 
     295                 :            : static inline struct rb_node *tree_search(struct extent_io_tree *tree,
     296                 :            :                                           u64 offset)
     297                 :            : {
     298                 :          0 :         struct rb_node *prev = NULL;
     299                 :            :         struct rb_node *ret;
     300                 :            : 
     301                 :          0 :         ret = __etree_search(tree, offset, &prev, NULL);
     302   [ #  #  #  #  :          0 :         if (!ret)
          #  #  #  #  #  
          #  #  #  #  #  
          #  #  #  #  #  
                      # ]
     303                 :          0 :                 return prev;
     304                 :            :         return ret;
     305                 :            : }
     306                 :            : 
     307                 :            : static void merge_cb(struct extent_io_tree *tree, struct extent_state *new,
     308                 :            :                      struct extent_state *other)
     309                 :            : {
     310 [ #  # ][ #  # ]:          0 :         if (tree->ops && tree->ops->merge_extent_hook)
         [ #  # ][ #  # ]
     311                 :          0 :                 tree->ops->merge_extent_hook(tree->mapping->host, new,
     312                 :            :                                              other);
     313                 :            : }
     314                 :            : 
     315                 :            : /*
     316                 :            :  * utility function to look for merge candidates inside a given range.
     317                 :            :  * Any extents with matching state are merged together into a single
     318                 :            :  * extent in the tree.  Extents with EXTENT_IO in their state field
     319                 :            :  * are not merged because the end_io handlers need to be able to do
     320                 :            :  * operations on them without sleeping (or doing allocations/splits).
     321                 :            :  *
     322                 :            :  * This should be called with the tree lock held.
     323                 :            :  */
     324                 :          0 : static void merge_state(struct extent_io_tree *tree,
     325                 :            :                         struct extent_state *state)
     326                 :            : {
     327                 :            :         struct extent_state *other;
     328                 :            :         struct rb_node *other_node;
     329                 :            : 
     330         [ #  # ]:          0 :         if (state->state & (EXTENT_IOBITS | EXTENT_BOUNDARY))
     331                 :          0 :                 return;
     332                 :            : 
     333                 :          0 :         other_node = rb_prev(&state->rb_node);
     334         [ #  # ]:          0 :         if (other_node) {
     335                 :          0 :                 other = rb_entry(other_node, struct extent_state, rb_node);
     336 [ #  # ][ #  # ]:          0 :                 if (other->end == state->start - 1 &&
     337                 :          0 :                     other->state == state->state) {
     338                 :            :                         merge_cb(tree, state, other);
     339                 :          0 :                         state->start = other->start;
     340                 :          0 :                         other->tree = NULL;
     341                 :          0 :                         rb_erase(&other->rb_node, &tree->state);
     342                 :          0 :                         free_extent_state(other);
     343                 :            :                 }
     344                 :            :         }
     345                 :          0 :         other_node = rb_next(&state->rb_node);
     346         [ #  # ]:          0 :         if (other_node) {
     347                 :          0 :                 other = rb_entry(other_node, struct extent_state, rb_node);
     348 [ #  # ][ #  # ]:          0 :                 if (other->start == state->end + 1 &&
     349                 :          0 :                     other->state == state->state) {
     350                 :            :                         merge_cb(tree, state, other);
     351                 :          0 :                         state->end = other->end;
     352                 :          0 :                         other->tree = NULL;
     353                 :          0 :                         rb_erase(&other->rb_node, &tree->state);
     354                 :          0 :                         free_extent_state(other);
     355                 :            :                 }
     356                 :            :         }
     357                 :            : }
     358                 :            : 
     359                 :            : static void set_state_cb(struct extent_io_tree *tree,
     360                 :            :                          struct extent_state *state, unsigned long *bits)
     361                 :            : {
     362 [ #  # ][ #  # ]:          0 :         if (tree->ops && tree->ops->set_bit_hook)
     363                 :          0 :                 tree->ops->set_bit_hook(tree->mapping->host, state, bits);
     364                 :            : }
     365                 :            : 
     366                 :            : static void clear_state_cb(struct extent_io_tree *tree,
     367                 :            :                            struct extent_state *state, unsigned long *bits)
     368                 :            : {
     369 [ #  # ][ #  # ]:          0 :         if (tree->ops && tree->ops->clear_bit_hook)
     370                 :          0 :                 tree->ops->clear_bit_hook(tree->mapping->host, state, bits);
     371                 :            : }
     372                 :            : 
     373                 :            : static void set_state_bits(struct extent_io_tree *tree,
     374                 :            :                            struct extent_state *state, unsigned long *bits);
     375                 :            : 
     376                 :            : /*
     377                 :            :  * insert an extent_state struct into the tree.  'bits' are set on the
     378                 :            :  * struct before it is inserted.
     379                 :            :  *
     380                 :            :  * This may return -EEXIST if the extent is already there, in which case the
     381                 :            :  * state struct is freed.
     382                 :            :  *
     383                 :            :  * The tree lock is not taken internally.  This is a utility function and
     384                 :            :  * probably isn't what you want to call (see set/clear_extent_bit).
     385                 :            :  */
     386                 :          0 : static int insert_state(struct extent_io_tree *tree,
     387                 :            :                         struct extent_state *state, u64 start, u64 end,
     388                 :            :                         unsigned long *bits)
     389                 :            : {
     390                 :            :         struct rb_node *node;
     391                 :            : 
     392         [ #  # ]:          0 :         if (end < start)
     393                 :          0 :                 WARN(1, KERN_ERR "btrfs end < start %llu %llu\n",
     394                 :            :                        end, start);
     395                 :          0 :         state->start = start;
     396                 :          0 :         state->end = end;
     397                 :            : 
     398                 :          0 :         set_state_bits(tree, state, bits);
     399                 :            : 
     400                 :          0 :         node = tree_insert(&tree->state, end, &state->rb_node);
     401         [ #  # ]:          0 :         if (node) {
     402                 :            :                 struct extent_state *found;
     403                 :            :                 found = rb_entry(node, struct extent_state, rb_node);
     404                 :          0 :                 printk(KERN_ERR "btrfs found node %llu %llu on insert of "
     405                 :            :                        "%llu %llu\n",
     406                 :            :                        found->start, found->end, start, end);
     407                 :          0 :                 return -EEXIST;
     408                 :            :         }
     409                 :          0 :         state->tree = tree;
     410                 :          0 :         merge_state(tree, state);
     411                 :          0 :         return 0;
     412                 :            : }
     413                 :            : 
     414                 :            : static void split_cb(struct extent_io_tree *tree, struct extent_state *orig,
     415                 :            :                      u64 split)
     416                 :            : {
     417 [ #  # ][ #  # ]:          0 :         if (tree->ops && tree->ops->split_extent_hook)
     418                 :          0 :                 tree->ops->split_extent_hook(tree->mapping->host, orig, split);
     419                 :            : }
     420                 :            : 
     421                 :            : /*
     422                 :            :  * split a given extent state struct in two, inserting the preallocated
     423                 :            :  * struct 'prealloc' as the newly created second half.  'split' indicates an
     424                 :            :  * offset inside 'orig' where it should be split.
     425                 :            :  *
     426                 :            :  * Before calling,
     427                 :            :  * the tree has 'orig' at [orig->start, orig->end].  After calling, there
     428                 :            :  * are two extent state structs in the tree:
     429                 :            :  * prealloc: [orig->start, split - 1]
     430                 :            :  * orig: [ split, orig->end ]
     431                 :            :  *
     432                 :            :  * The tree locks are not taken by this function. They need to be held
     433                 :            :  * by the caller.
     434                 :            :  */
     435                 :          0 : static int split_state(struct extent_io_tree *tree, struct extent_state *orig,
     436                 :            :                        struct extent_state *prealloc, u64 split)
     437                 :            : {
     438                 :            :         struct rb_node *node;
     439                 :            : 
     440                 :            :         split_cb(tree, orig, split);
     441                 :            : 
     442                 :          0 :         prealloc->start = orig->start;
     443                 :          0 :         prealloc->end = split - 1;
     444                 :          0 :         prealloc->state = orig->state;
     445                 :          0 :         orig->start = split;
     446                 :            : 
     447                 :          0 :         node = tree_insert(&tree->state, prealloc->end, &prealloc->rb_node);
     448         [ #  # ]:          0 :         if (node) {
     449                 :          0 :                 free_extent_state(prealloc);
     450                 :          0 :                 return -EEXIST;
     451                 :            :         }
     452                 :          0 :         prealloc->tree = tree;
     453                 :          0 :         return 0;
     454                 :            : }
     455                 :            : 
     456                 :            : static struct extent_state *next_state(struct extent_state *state)
     457                 :            : {
     458                 :          0 :         struct rb_node *next = rb_next(&state->rb_node);
     459   [ #  #  #  #  :          0 :         if (next)
          #  #  #  #  #  
                      # ]
     460                 :          0 :                 return rb_entry(next, struct extent_state, rb_node);
     461                 :            :         else
     462                 :            :                 return NULL;
     463                 :            : }
     464                 :            : 
     465                 :            : /*
     466                 :            :  * utility function to clear some bits in an extent state struct.
     467                 :            :  * it will optionally wake up any one waiting on this state (wake == 1).
     468                 :            :  *
     469                 :            :  * If no bits are set on the state struct after clearing things, the
     470                 :            :  * struct is freed and removed from the tree
     471                 :            :  */
     472                 :          0 : static struct extent_state *clear_state_bit(struct extent_io_tree *tree,
     473                 :            :                                             struct extent_state *state,
     474                 :            :                                             unsigned long *bits, int wake)
     475                 :            : {
     476                 :            :         struct extent_state *next;
     477                 :          0 :         unsigned long bits_to_clear = *bits & ~EXTENT_CTLBITS;
     478                 :            : 
     479 [ #  # ][ #  # ]:          0 :         if ((bits_to_clear & EXTENT_DIRTY) && (state->state & EXTENT_DIRTY)) {
     480                 :          0 :                 u64 range = state->end - state->start + 1;
     481         [ #  # ]:          0 :                 WARN_ON(range > tree->dirty_bytes);
     482                 :          0 :                 tree->dirty_bytes -= range;
     483                 :            :         }
     484                 :            :         clear_state_cb(tree, state, bits);
     485                 :          0 :         state->state &= ~bits_to_clear;
     486         [ #  # ]:          0 :         if (wake)
     487                 :          0 :                 wake_up(&state->wq);
     488         [ #  # ]:          0 :         if (state->state == 0) {
     489                 :            :                 next = next_state(state);
     490         [ #  # ]:          0 :                 if (state->tree) {
     491                 :          0 :                         rb_erase(&state->rb_node, &tree->state);
     492                 :          0 :                         state->tree = NULL;
     493                 :          0 :                         free_extent_state(state);
     494                 :            :                 } else {
     495                 :          0 :                         WARN_ON(1);
     496                 :            :                 }
     497                 :            :         } else {
     498                 :          0 :                 merge_state(tree, state);
     499                 :            :                 next = next_state(state);
     500                 :            :         }
     501                 :          0 :         return next;
     502                 :            : }
     503                 :            : 
     504                 :            : static struct extent_state *
     505                 :            : alloc_extent_state_atomic(struct extent_state *prealloc)
     506                 :            : {
     507 [ #  # ][ #  # ]:          0 :         if (!prealloc)
         [ #  # ][ #  # ]
         [ #  # ][ #  # ]
         [ #  # ][ #  # ]
         [ #  # ][ #  # ]
     508                 :          0 :                 prealloc = alloc_extent_state(GFP_ATOMIC);
     509                 :            : 
     510                 :            :         return prealloc;
     511                 :            : }
     512                 :            : 
     513                 :          0 : static void extent_io_tree_panic(struct extent_io_tree *tree, int err)
     514                 :            : {
     515                 :          0 :         btrfs_panic(tree_fs_info(tree), err, "Locking error: "
     516                 :            :                     "Extent tree was modified by another "
     517                 :            :                     "thread while locked.");
     518                 :            : }
     519                 :            : 
     520                 :            : /*
     521                 :            :  * clear some bits on a range in the tree.  This may require splitting
     522                 :            :  * or inserting elements in the tree, so the gfp mask is used to
     523                 :            :  * indicate which allocations or sleeping are allowed.
     524                 :            :  *
     525                 :            :  * pass 'wake' == 1 to kick any sleepers, and 'delete' == 1 to remove
     526                 :            :  * the given range from the tree regardless of state (ie for truncate).
     527                 :            :  *
     528                 :            :  * the range [start, end] is inclusive.
     529                 :            :  *
     530                 :            :  * This takes the tree lock, and returns 0 on success and < 0 on error.
     531                 :            :  */
     532                 :          0 : int clear_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,
     533                 :            :                      unsigned long bits, int wake, int delete,
     534                 :            :                      struct extent_state **cached_state,
     535                 :            :                      gfp_t mask)
     536                 :            : {
     537                 :            :         struct extent_state *state;
     538                 :            :         struct extent_state *cached;
     539                 :            :         struct extent_state *prealloc = NULL;
     540                 :            :         struct rb_node *node;
     541                 :            :         u64 last_end;
     542                 :            :         int err;
     543                 :            :         int clear = 0;
     544                 :            : 
     545                 :            :         btrfs_debug_check_extent_io_range(tree->mapping->host, start, end);
     546                 :            : 
     547         [ #  # ]:          0 :         if (bits & EXTENT_DELALLOC)
     548                 :          0 :                 bits |= EXTENT_NORESERVE;
     549                 :            : 
     550         [ #  # ]:          0 :         if (delete)
     551                 :          0 :                 bits |= ~EXTENT_CTLBITS;
     552                 :          0 :         bits |= EXTENT_FIRST_DELALLOC;
     553                 :            : 
     554         [ #  # ]:          0 :         if (bits & (EXTENT_IOBITS | EXTENT_BOUNDARY))
     555                 :            :                 clear = 1;
     556                 :            : again:
     557 [ #  # ][ #  # ]:          0 :         if (!prealloc && (mask & __GFP_WAIT)) {
     558                 :          0 :                 prealloc = alloc_extent_state(mask);
     559         [ #  # ]:          0 :                 if (!prealloc)
     560                 :            :                         return -ENOMEM;
     561                 :            :         }
     562                 :            : 
     563                 :            :         spin_lock(&tree->lock);
     564         [ #  # ]:          0 :         if (cached_state) {
     565                 :          0 :                 cached = *cached_state;
     566                 :            : 
     567         [ #  # ]:          0 :                 if (clear) {
     568                 :          0 :                         *cached_state = NULL;
     569                 :            :                         cached_state = NULL;
     570                 :            :                 }
     571                 :            : 
     572 [ #  # ][ #  # ]:          0 :                 if (cached && cached->tree && cached->start <= start &&
         [ #  # ][ #  # ]
     573                 :          0 :                     cached->end > start) {
     574         [ #  # ]:          0 :                         if (clear)
     575                 :          0 :                                 atomic_dec(&cached->refs);
     576                 :            :                         state = cached;
     577                 :          0 :                         goto hit_next;
     578                 :            :                 }
     579         [ #  # ]:          0 :                 if (clear)
     580                 :          0 :                         free_extent_state(cached);
     581                 :            :         }
     582                 :            :         /*
     583                 :            :          * this search will find the extents that end after
     584                 :            :          * our range starts
     585                 :            :          */
     586                 :            :         node = tree_search(tree, start);
     587         [ #  # ]:          0 :         if (!node)
     588                 :            :                 goto out;
     589                 :          0 :         state = rb_entry(node, struct extent_state, rb_node);
     590                 :            : hit_next:
     591         [ #  # ]:          0 :         if (state->start > end)
     592                 :            :                 goto out;
     593         [ #  # ]:          0 :         WARN_ON(state->end < start);
     594                 :          0 :         last_end = state->end;
     595                 :            : 
     596                 :            :         /* the state doesn't have the wanted bits, go ahead */
     597         [ #  # ]:          0 :         if (!(state->state & bits)) {
     598                 :            :                 state = next_state(state);
     599                 :          0 :                 goto next;
     600                 :            :         }
     601                 :            : 
     602                 :            :         /*
     603                 :            :          *     | ---- desired range ---- |
     604                 :            :          *  | state | or
     605                 :            :          *  | ------------- state -------------- |
     606                 :            :          *
     607                 :            :          * We need to split the extent we found, and may flip
     608                 :            :          * bits on second half.
     609                 :            :          *
     610                 :            :          * If the extent we found extends past our range, we
     611                 :            :          * just split and search again.  It'll get split again
     612                 :            :          * the next time though.
     613                 :            :          *
     614                 :            :          * If the extent we found is inside our range, we clear
     615                 :            :          * the desired bit on it.
     616                 :            :          */
     617                 :            : 
     618         [ #  # ]:          0 :         if (state->start < start) {
     619                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
     620         [ #  # ]:          0 :                 BUG_ON(!prealloc);
     621                 :          0 :                 err = split_state(tree, state, prealloc, start);
     622         [ #  # ]:          0 :                 if (err)
     623                 :          0 :                         extent_io_tree_panic(tree, err);
     624                 :            : 
     625                 :            :                 prealloc = NULL;
     626         [ #  # ]:          0 :                 if (err)
     627                 :            :                         goto out;
     628         [ #  # ]:          0 :                 if (state->end <= end) {
     629                 :          0 :                         state = clear_state_bit(tree, state, &bits, wake);
     630                 :          0 :                         goto next;
     631                 :            :                 }
     632                 :            :                 goto search_again;
     633                 :            :         }
     634                 :            :         /*
     635                 :            :          * | ---- desired range ---- |
     636                 :            :          *                        | state |
     637                 :            :          * We need to split the extent, and clear the bit
     638                 :            :          * on the first half
     639                 :            :          */
     640 [ #  # ][ #  # ]:          0 :         if (state->start <= end && state->end > end) {
     641                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
     642         [ #  # ]:          0 :                 BUG_ON(!prealloc);
     643                 :          0 :                 err = split_state(tree, state, prealloc, end + 1);
     644         [ #  # ]:          0 :                 if (err)
     645                 :          0 :                         extent_io_tree_panic(tree, err);
     646                 :            : 
     647         [ #  # ]:          0 :                 if (wake)
     648                 :          0 :                         wake_up(&state->wq);
     649                 :            : 
     650                 :          0 :                 clear_state_bit(tree, prealloc, &bits, wake);
     651                 :            : 
     652                 :            :                 prealloc = NULL;
     653                 :          0 :                 goto out;
     654                 :            :         }
     655                 :            : 
     656                 :          0 :         state = clear_state_bit(tree, state, &bits, wake);
     657                 :            : next:
     658         [ #  # ]:          0 :         if (last_end == (u64)-1)
     659                 :            :                 goto out;
     660                 :          0 :         start = last_end + 1;
     661 [ #  # ][ #  # ]:          0 :         if (start <= end && state && !need_resched())
     662                 :            :                 goto hit_next;
     663                 :            :         goto search_again;
     664                 :            : 
     665                 :            : out:
     666                 :            :         spin_unlock(&tree->lock);
     667         [ #  # ]:          0 :         if (prealloc)
     668                 :          0 :                 free_extent_state(prealloc);
     669                 :            : 
     670                 :            :         return 0;
     671                 :            : 
     672                 :            : search_again:
     673         [ #  # ]:          0 :         if (start > end)
     674                 :            :                 goto out;
     675                 :            :         spin_unlock(&tree->lock);
     676         [ #  # ]:          0 :         if (mask & __GFP_WAIT)
     677                 :          0 :                 cond_resched();
     678                 :            :         goto again;
     679                 :            : }
     680                 :            : 
     681                 :          0 : static void wait_on_state(struct extent_io_tree *tree,
     682                 :            :                           struct extent_state *state)
     683                 :            :                 __releases(tree->lock)
     684                 :            :                 __acquires(tree->lock)
     685                 :            : {
     686                 :          0 :         DEFINE_WAIT(wait);
     687                 :          0 :         prepare_to_wait(&state->wq, &wait, TASK_UNINTERRUPTIBLE);
     688                 :            :         spin_unlock(&tree->lock);
     689                 :          0 :         schedule();
     690                 :            :         spin_lock(&tree->lock);
     691                 :          0 :         finish_wait(&state->wq, &wait);
     692                 :          0 : }
     693                 :            : 
     694                 :            : /*
     695                 :            :  * waits for one or more bits to clear on a range in the state tree.
     696                 :            :  * The range [start, end] is inclusive.
     697                 :            :  * The tree lock is taken by this function
     698                 :            :  */
     699                 :          0 : static void wait_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,
     700                 :            :                             unsigned long bits)
     701                 :            : {
     702                 :            :         struct extent_state *state;
     703                 :            :         struct rb_node *node;
     704                 :            : 
     705                 :            :         btrfs_debug_check_extent_io_range(tree->mapping->host, start, end);
     706                 :            : 
     707                 :            :         spin_lock(&tree->lock);
     708                 :            : again:
     709                 :            :         while (1) {
     710                 :            :                 /*
     711                 :            :                  * this search will find all the extents that end after
     712                 :            :                  * our range starts
     713                 :            :                  */
     714                 :            :                 node = tree_search(tree, start);
     715         [ #  # ]:          0 :                 if (!node)
     716                 :            :                         break;
     717                 :            : 
     718                 :          0 :                 state = rb_entry(node, struct extent_state, rb_node);
     719                 :            : 
     720         [ #  # ]:          0 :                 if (state->start > end)
     721                 :            :                         goto out;
     722                 :            : 
     723         [ #  # ]:          0 :                 if (state->state & bits) {
     724                 :            :                         start = state->start;
     725                 :          0 :                         atomic_inc(&state->refs);
     726                 :          0 :                         wait_on_state(tree, state);
     727                 :          0 :                         free_extent_state(state);
     728                 :          0 :                         goto again;
     729                 :            :                 }
     730                 :          0 :                 start = state->end + 1;
     731                 :            : 
     732         [ #  # ]:          0 :                 if (start > end)
     733                 :            :                         break;
     734                 :            : 
     735                 :          0 :                 cond_resched_lock(&tree->lock);
     736                 :          0 :         }
     737                 :            : out:
     738                 :            :         spin_unlock(&tree->lock);
     739                 :          0 : }
     740                 :            : 
     741                 :          0 : static void set_state_bits(struct extent_io_tree *tree,
     742                 :            :                            struct extent_state *state,
     743                 :            :                            unsigned long *bits)
     744                 :            : {
     745                 :          0 :         unsigned long bits_to_set = *bits & ~EXTENT_CTLBITS;
     746                 :            : 
     747                 :            :         set_state_cb(tree, state, bits);
     748 [ #  # ][ #  # ]:          0 :         if ((bits_to_set & EXTENT_DIRTY) && !(state->state & EXTENT_DIRTY)) {
     749                 :          0 :                 u64 range = state->end - state->start + 1;
     750                 :          0 :                 tree->dirty_bytes += range;
     751                 :            :         }
     752                 :          0 :         state->state |= bits_to_set;
     753                 :          0 : }
     754                 :            : 
     755                 :          0 : static void cache_state(struct extent_state *state,
     756                 :            :                         struct extent_state **cached_ptr)
     757                 :            : {
     758 [ #  # ][ #  # ]:          0 :         if (cached_ptr && !(*cached_ptr)) {
     759         [ #  # ]:          0 :                 if (state->state & (EXTENT_IOBITS | EXTENT_BOUNDARY)) {
     760                 :          0 :                         *cached_ptr = state;
     761                 :          0 :                         atomic_inc(&state->refs);
     762                 :            :                 }
     763                 :            :         }
     764                 :          0 : }
     765                 :            : 
     766                 :            : /*
     767                 :            :  * set some bits on a range in the tree.  This may require allocations or
     768                 :            :  * sleeping, so the gfp mask is used to indicate what is allowed.
     769                 :            :  *
     770                 :            :  * If any of the exclusive bits are set, this will fail with -EEXIST if some
     771                 :            :  * part of the range already has the desired bits set.  The start of the
     772                 :            :  * existing range is returned in failed_start in this case.
     773                 :            :  *
     774                 :            :  * [start, end] is inclusive This takes the tree lock.
     775                 :            :  */
     776                 :            : 
     777                 :            : static int __must_check
     778                 :          0 : __set_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,
     779                 :            :                  unsigned long bits, unsigned long exclusive_bits,
     780                 :            :                  u64 *failed_start, struct extent_state **cached_state,
     781                 :            :                  gfp_t mask)
     782                 :            : {
     783                 :            :         struct extent_state *state;
     784                 :            :         struct extent_state *prealloc = NULL;
     785                 :            :         struct rb_node *node;
     786                 :            :         int err = 0;
     787                 :            :         u64 last_start;
     788                 :            :         u64 last_end;
     789                 :            : 
     790                 :            :         btrfs_debug_check_extent_io_range(tree->mapping->host, start, end);
     791                 :            : 
     792                 :          0 :         bits |= EXTENT_FIRST_DELALLOC;
     793                 :            : again:
     794 [ #  # ][ #  # ]:          0 :         if (!prealloc && (mask & __GFP_WAIT)) {
     795                 :          0 :                 prealloc = alloc_extent_state(mask);
     796         [ #  # ]:          0 :                 BUG_ON(!prealloc);
     797                 :            :         }
     798                 :            : 
     799                 :            :         spin_lock(&tree->lock);
     800 [ #  # ][ #  # ]:          0 :         if (cached_state && *cached_state) {
     801                 :            :                 state = *cached_state;
     802 [ #  # ][ #  # ]:          0 :                 if (state->start <= start && state->end > start &&
                 [ #  # ]
     803                 :          0 :                     state->tree) {
     804                 :            :                         node = &state->rb_node;
     805                 :            :                         goto hit_next;
     806                 :            :                 }
     807                 :            :         }
     808                 :            :         /*
     809                 :            :          * this search will find all the extents that end after
     810                 :            :          * our range starts.
     811                 :            :          */
     812                 :            :         node = tree_search(tree, start);
     813         [ #  # ]:          0 :         if (!node) {
     814                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
     815         [ #  # ]:          0 :                 BUG_ON(!prealloc);
     816                 :          0 :                 err = insert_state(tree, prealloc, start, end, &bits);
     817         [ #  # ]:          0 :                 if (err)
     818                 :          0 :                         extent_io_tree_panic(tree, err);
     819                 :            : 
     820                 :            :                 prealloc = NULL;
     821                 :            :                 goto out;
     822                 :            :         }
     823                 :          0 :         state = rb_entry(node, struct extent_state, rb_node);
     824                 :            : hit_next:
     825                 :          0 :         last_start = state->start;
     826                 :          0 :         last_end = state->end;
     827                 :            : 
     828                 :            :         /*
     829                 :            :          * | ---- desired range ---- |
     830                 :            :          * | state |
     831                 :            :          *
     832                 :            :          * Just lock what we found and keep going
     833                 :            :          */
     834 [ #  # ][ #  # ]:          0 :         if (state->start == start && state->end <= end) {
     835         [ #  # ]:          0 :                 if (state->state & exclusive_bits) {
     836                 :          0 :                         *failed_start = state->start;
     837                 :            :                         err = -EEXIST;
     838                 :          0 :                         goto out;
     839                 :            :                 }
     840                 :            : 
     841                 :          0 :                 set_state_bits(tree, state, &bits);
     842                 :          0 :                 cache_state(state, cached_state);
     843                 :          0 :                 merge_state(tree, state);
     844         [ #  # ]:          0 :                 if (last_end == (u64)-1)
     845                 :            :                         goto out;
     846                 :          0 :                 start = last_end + 1;
     847                 :            :                 state = next_state(state);
     848 [ #  # ][ #  # ]:          0 :                 if (start < end && state && state->start == start &&
                 [ #  # ]
     849                 :            :                     !need_resched())
     850                 :            :                         goto hit_next;
     851                 :            :                 goto search_again;
     852                 :            :         }
     853                 :            : 
     854                 :            :         /*
     855                 :            :          *     | ---- desired range ---- |
     856                 :            :          * | state |
     857                 :            :          *   or
     858                 :            :          * | ------------- state -------------- |
     859                 :            :          *
     860                 :            :          * We need to split the extent we found, and may flip bits on
     861                 :            :          * second half.
     862                 :            :          *
     863                 :            :          * If the extent we found extends past our
     864                 :            :          * range, we just split and search again.  It'll get split
     865                 :            :          * again the next time though.
     866                 :            :          *
     867                 :            :          * If the extent we found is inside our range, we set the
     868                 :            :          * desired bit on it.
     869                 :            :          */
     870         [ #  # ]:          0 :         if (state->start < start) {
     871         [ #  # ]:          0 :                 if (state->state & exclusive_bits) {
     872                 :          0 :                         *failed_start = start;
     873                 :            :                         err = -EEXIST;
     874                 :          0 :                         goto out;
     875                 :            :                 }
     876                 :            : 
     877                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
     878         [ #  # ]:          0 :                 BUG_ON(!prealloc);
     879                 :          0 :                 err = split_state(tree, state, prealloc, start);
     880         [ #  # ]:          0 :                 if (err)
     881                 :          0 :                         extent_io_tree_panic(tree, err);
     882                 :            : 
     883                 :            :                 prealloc = NULL;
     884         [ #  # ]:          0 :                 if (err)
     885                 :            :                         goto out;
     886         [ #  # ]:          0 :                 if (state->end <= end) {
     887                 :          0 :                         set_state_bits(tree, state, &bits);
     888                 :          0 :                         cache_state(state, cached_state);
     889                 :          0 :                         merge_state(tree, state);
     890         [ #  # ]:          0 :                         if (last_end == (u64)-1)
     891                 :            :                                 goto out;
     892                 :          0 :                         start = last_end + 1;
     893                 :            :                         state = next_state(state);
     894 [ #  # ][ #  # ]:          0 :                         if (start < end && state && state->start == start &&
                 [ #  # ]
     895                 :            :                             !need_resched())
     896                 :            :                                 goto hit_next;
     897                 :            :                 }
     898                 :            :                 goto search_again;
     899                 :            :         }
     900                 :            :         /*
     901                 :            :          * | ---- desired range ---- |
     902                 :            :          *     | state | or               | state |
     903                 :            :          *
     904                 :            :          * There's a hole, we need to insert something in it and
     905                 :            :          * ignore the extent we found.
     906                 :            :          */
     907         [ #  # ]:          0 :         if (state->start > start) {
     908                 :            :                 u64 this_end;
     909         [ #  # ]:          0 :                 if (end < last_start)
     910                 :            :                         this_end = end;
     911                 :            :                 else
     912                 :          0 :                         this_end = last_start - 1;
     913                 :            : 
     914                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
     915         [ #  # ]:          0 :                 BUG_ON(!prealloc);
     916                 :            : 
     917                 :            :                 /*
     918                 :            :                  * Avoid to free 'prealloc' if it can be merged with
     919                 :            :                  * the later extent.
     920                 :            :                  */
     921                 :          0 :                 err = insert_state(tree, prealloc, start, this_end,
     922                 :            :                                    &bits);
     923         [ #  # ]:          0 :                 if (err)
     924                 :          0 :                         extent_io_tree_panic(tree, err);
     925                 :            : 
     926                 :          0 :                 cache_state(prealloc, cached_state);
     927                 :            :                 prealloc = NULL;
     928                 :          0 :                 start = this_end + 1;
     929                 :          0 :                 goto search_again;
     930                 :            :         }
     931                 :            :         /*
     932                 :            :          * | ---- desired range ---- |
     933                 :            :          *                        | state |
     934                 :            :          * We need to split the extent, and set the bit
     935                 :            :          * on the first half
     936                 :            :          */
     937 [ #  # ][ #  # ]:          0 :         if (state->start <= end && state->end > end) {
     938         [ #  # ]:          0 :                 if (state->state & exclusive_bits) {
     939                 :          0 :                         *failed_start = start;
     940                 :            :                         err = -EEXIST;
     941                 :          0 :                         goto out;
     942                 :            :                 }
     943                 :            : 
     944                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
     945         [ #  # ]:          0 :                 BUG_ON(!prealloc);
     946                 :          0 :                 err = split_state(tree, state, prealloc, end + 1);
     947         [ #  # ]:          0 :                 if (err)
     948                 :          0 :                         extent_io_tree_panic(tree, err);
     949                 :            : 
     950                 :          0 :                 set_state_bits(tree, prealloc, &bits);
     951                 :          0 :                 cache_state(prealloc, cached_state);
     952                 :          0 :                 merge_state(tree, prealloc);
     953                 :            :                 prealloc = NULL;
     954                 :          0 :                 goto out;
     955                 :            :         }
     956                 :            : 
     957                 :            :         goto search_again;
     958                 :            : 
     959                 :            : out:
     960                 :            :         spin_unlock(&tree->lock);
     961         [ #  # ]:          0 :         if (prealloc)
     962                 :          0 :                 free_extent_state(prealloc);
     963                 :            : 
     964                 :          0 :         return err;
     965                 :            : 
     966                 :            : search_again:
     967         [ #  # ]:          0 :         if (start > end)
     968                 :            :                 goto out;
     969                 :            :         spin_unlock(&tree->lock);
     970         [ #  # ]:          0 :         if (mask & __GFP_WAIT)
     971                 :          0 :                 cond_resched();
     972                 :            :         goto again;
     973                 :            : }
     974                 :            : 
     975                 :          0 : int set_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,
     976                 :            :                    unsigned long bits, u64 * failed_start,
     977                 :            :                    struct extent_state **cached_state, gfp_t mask)
     978                 :            : {
     979                 :          0 :         return __set_extent_bit(tree, start, end, bits, 0, failed_start,
     980                 :            :                                 cached_state, mask);
     981                 :            : }
     982                 :            : 
     983                 :            : 
     984                 :            : /**
     985                 :            :  * convert_extent_bit - convert all bits in a given range from one bit to
     986                 :            :  *                      another
     987                 :            :  * @tree:       the io tree to search
     988                 :            :  * @start:      the start offset in bytes
     989                 :            :  * @end:        the end offset in bytes (inclusive)
     990                 :            :  * @bits:       the bits to set in this range
     991                 :            :  * @clear_bits: the bits to clear in this range
     992                 :            :  * @cached_state:       state that we're going to cache
     993                 :            :  * @mask:       the allocation mask
     994                 :            :  *
     995                 :            :  * This will go through and set bits for the given range.  If any states exist
     996                 :            :  * already in this range they are set with the given bit and cleared of the
     997                 :            :  * clear_bits.  This is only meant to be used by things that are mergeable, ie
     998                 :            :  * converting from say DELALLOC to DIRTY.  This is not meant to be used with
     999                 :            :  * boundary bits like LOCK.
    1000                 :            :  */
    1001                 :          0 : int convert_extent_bit(struct extent_io_tree *tree, u64 start, u64 end,
    1002                 :            :                        unsigned long bits, unsigned long clear_bits,
    1003                 :            :                        struct extent_state **cached_state, gfp_t mask)
    1004                 :            : {
    1005                 :            :         struct extent_state *state;
    1006                 :            :         struct extent_state *prealloc = NULL;
    1007                 :            :         struct rb_node *node;
    1008                 :            :         int err = 0;
    1009                 :            :         u64 last_start;
    1010                 :            :         u64 last_end;
    1011                 :            : 
    1012                 :            :         btrfs_debug_check_extent_io_range(tree->mapping->host, start, end);
    1013                 :            : 
    1014                 :            : again:
    1015 [ #  # ][ #  # ]:          0 :         if (!prealloc && (mask & __GFP_WAIT)) {
    1016                 :          0 :                 prealloc = alloc_extent_state(mask);
    1017         [ #  # ]:          0 :                 if (!prealloc)
    1018                 :            :                         return -ENOMEM;
    1019                 :            :         }
    1020                 :            : 
    1021                 :            :         spin_lock(&tree->lock);
    1022 [ #  # ][ #  # ]:          0 :         if (cached_state && *cached_state) {
    1023                 :            :                 state = *cached_state;
    1024 [ #  # ][ #  # ]:          0 :                 if (state->start <= start && state->end > start &&
                 [ #  # ]
    1025                 :          0 :                     state->tree) {
    1026                 :            :                         node = &state->rb_node;
    1027                 :            :                         goto hit_next;
    1028                 :            :                 }
    1029                 :            :         }
    1030                 :            : 
    1031                 :            :         /*
    1032                 :            :          * this search will find all the extents that end after
    1033                 :            :          * our range starts.
    1034                 :            :          */
    1035                 :            :         node = tree_search(tree, start);
    1036         [ #  # ]:          0 :         if (!node) {
    1037                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
    1038         [ #  # ]:          0 :                 if (!prealloc) {
    1039                 :            :                         err = -ENOMEM;
    1040                 :            :                         goto out;
    1041                 :            :                 }
    1042                 :          0 :                 err = insert_state(tree, prealloc, start, end, &bits);
    1043                 :            :                 prealloc = NULL;
    1044         [ #  # ]:          0 :                 if (err)
    1045                 :          0 :                         extent_io_tree_panic(tree, err);
    1046                 :            :                 goto out;
    1047                 :            :         }
    1048                 :          0 :         state = rb_entry(node, struct extent_state, rb_node);
    1049                 :            : hit_next:
    1050                 :          0 :         last_start = state->start;
    1051                 :          0 :         last_end = state->end;
    1052                 :            : 
    1053                 :            :         /*
    1054                 :            :          * | ---- desired range ---- |
    1055                 :            :          * | state |
    1056                 :            :          *
    1057                 :            :          * Just lock what we found and keep going
    1058                 :            :          */
    1059 [ #  # ][ #  # ]:          0 :         if (state->start == start && state->end <= end) {
    1060                 :          0 :                 set_state_bits(tree, state, &bits);
    1061                 :          0 :                 cache_state(state, cached_state);
    1062                 :          0 :                 state = clear_state_bit(tree, state, &clear_bits, 0);
    1063         [ #  # ]:          0 :                 if (last_end == (u64)-1)
    1064                 :            :                         goto out;
    1065                 :          0 :                 start = last_end + 1;
    1066 [ #  # ][ #  # ]:          0 :                 if (start < end && state && state->start == start &&
                 [ #  # ]
    1067                 :            :                     !need_resched())
    1068                 :            :                         goto hit_next;
    1069                 :            :                 goto search_again;
    1070                 :            :         }
    1071                 :            : 
    1072                 :            :         /*
    1073                 :            :          *     | ---- desired range ---- |
    1074                 :            :          * | state |
    1075                 :            :          *   or
    1076                 :            :          * | ------------- state -------------- |
    1077                 :            :          *
    1078                 :            :          * We need to split the extent we found, and may flip bits on
    1079                 :            :          * second half.
    1080                 :            :          *
    1081                 :            :          * If the extent we found extends past our
    1082                 :            :          * range, we just split and search again.  It'll get split
    1083                 :            :          * again the next time though.
    1084                 :            :          *
    1085                 :            :          * If the extent we found is inside our range, we set the
    1086                 :            :          * desired bit on it.
    1087                 :            :          */
    1088         [ #  # ]:          0 :         if (state->start < start) {
    1089                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
    1090         [ #  # ]:          0 :                 if (!prealloc) {
    1091                 :            :                         err = -ENOMEM;
    1092                 :            :                         goto out;
    1093                 :            :                 }
    1094                 :          0 :                 err = split_state(tree, state, prealloc, start);
    1095         [ #  # ]:          0 :                 if (err)
    1096                 :          0 :                         extent_io_tree_panic(tree, err);
    1097                 :            :                 prealloc = NULL;
    1098         [ #  # ]:          0 :                 if (err)
    1099                 :            :                         goto out;
    1100         [ #  # ]:          0 :                 if (state->end <= end) {
    1101                 :          0 :                         set_state_bits(tree, state, &bits);
    1102                 :          0 :                         cache_state(state, cached_state);
    1103                 :          0 :                         state = clear_state_bit(tree, state, &clear_bits, 0);
    1104         [ #  # ]:          0 :                         if (last_end == (u64)-1)
    1105                 :            :                                 goto out;
    1106                 :          0 :                         start = last_end + 1;
    1107 [ #  # ][ #  # ]:          0 :                         if (start < end && state && state->start == start &&
                 [ #  # ]
    1108                 :            :                             !need_resched())
    1109                 :            :                                 goto hit_next;
    1110                 :            :                 }
    1111                 :            :                 goto search_again;
    1112                 :            :         }
    1113                 :            :         /*
    1114                 :            :          * | ---- desired range ---- |
    1115                 :            :          *     | state | or               | state |
    1116                 :            :          *
    1117                 :            :          * There's a hole, we need to insert something in it and
    1118                 :            :          * ignore the extent we found.
    1119                 :            :          */
    1120         [ #  # ]:          0 :         if (state->start > start) {
    1121                 :            :                 u64 this_end;
    1122         [ #  # ]:          0 :                 if (end < last_start)
    1123                 :            :                         this_end = end;
    1124                 :            :                 else
    1125                 :          0 :                         this_end = last_start - 1;
    1126                 :            : 
    1127                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
    1128         [ #  # ]:          0 :                 if (!prealloc) {
    1129                 :            :                         err = -ENOMEM;
    1130                 :            :                         goto out;
    1131                 :            :                 }
    1132                 :            : 
    1133                 :            :                 /*
    1134                 :            :                  * Avoid to free 'prealloc' if it can be merged with
    1135                 :            :                  * the later extent.
    1136                 :            :                  */
    1137                 :          0 :                 err = insert_state(tree, prealloc, start, this_end,
    1138                 :            :                                    &bits);
    1139         [ #  # ]:          0 :                 if (err)
    1140                 :          0 :                         extent_io_tree_panic(tree, err);
    1141                 :          0 :                 cache_state(prealloc, cached_state);
    1142                 :            :                 prealloc = NULL;
    1143                 :          0 :                 start = this_end + 1;
    1144                 :          0 :                 goto search_again;
    1145                 :            :         }
    1146                 :            :         /*
    1147                 :            :          * | ---- desired range ---- |
    1148                 :            :          *                        | state |
    1149                 :            :          * We need to split the extent, and set the bit
    1150                 :            :          * on the first half
    1151                 :            :          */
    1152 [ #  # ][ #  # ]:          0 :         if (state->start <= end && state->end > end) {
    1153                 :            :                 prealloc = alloc_extent_state_atomic(prealloc);
    1154         [ #  # ]:          0 :                 if (!prealloc) {
    1155                 :            :                         err = -ENOMEM;
    1156                 :            :                         goto out;
    1157                 :            :                 }
    1158                 :            : 
    1159                 :          0 :                 err = split_state(tree, state, prealloc, end + 1);
    1160         [ #  # ]:          0 :                 if (err)
    1161                 :          0 :                         extent_io_tree_panic(tree, err);
    1162                 :            : 
    1163                 :          0 :                 set_state_bits(tree, prealloc, &bits);
    1164                 :          0 :                 cache_state(prealloc, cached_state);
    1165                 :          0 :                 clear_state_bit(tree, prealloc, &clear_bits, 0);
    1166                 :            :                 prealloc = NULL;
    1167                 :          0 :                 goto out;
    1168                 :            :         }
    1169                 :            : 
    1170                 :            :         goto search_again;
    1171                 :            : 
    1172                 :            : out:
    1173                 :            :         spin_unlock(&tree->lock);
    1174         [ #  # ]:          0 :         if (prealloc)
    1175                 :          0 :                 free_extent_state(prealloc);
    1176                 :            : 
    1177                 :          0 :         return err;
    1178                 :            : 
    1179                 :            : search_again:
    1180         [ #  # ]:          0 :         if (start > end)
    1181                 :            :                 goto out;
    1182                 :            :         spin_unlock(&tree->lock);
    1183         [ #  # ]:          0 :         if (mask & __GFP_WAIT)
    1184                 :          0 :                 cond_resched();
    1185                 :            :         goto again;
    1186                 :            : }
    1187                 :            : 
    1188                 :            : /* wrappers around set/clear extent bit */
    1189                 :          0 : int set_extent_dirty(struct extent_io_tree *tree, u64 start, u64 end,
    1190                 :            :                      gfp_t mask)
    1191                 :            : {
    1192                 :          0 :         return set_extent_bit(tree, start, end, EXTENT_DIRTY, NULL,
    1193                 :            :                               NULL, mask);
    1194                 :            : }
    1195                 :            : 
    1196                 :          0 : int set_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,
    1197                 :            :                     unsigned long bits, gfp_t mask)
    1198                 :            : {
    1199                 :          0 :         return set_extent_bit(tree, start, end, bits, NULL,
    1200                 :            :                               NULL, mask);
    1201                 :            : }
    1202                 :            : 
    1203                 :          0 : int clear_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,
    1204                 :            :                       unsigned long bits, gfp_t mask)
    1205                 :            : {
    1206                 :          0 :         return clear_extent_bit(tree, start, end, bits, 0, 0, NULL, mask);
    1207                 :            : }
    1208                 :            : 
    1209                 :          0 : int set_extent_delalloc(struct extent_io_tree *tree, u64 start, u64 end,
    1210                 :            :                         struct extent_state **cached_state, gfp_t mask)
    1211                 :            : {
    1212                 :          0 :         return set_extent_bit(tree, start, end,
    1213                 :            :                               EXTENT_DELALLOC | EXTENT_UPTODATE,
    1214                 :            :                               NULL, cached_state, mask);
    1215                 :            : }
    1216                 :            : 
    1217                 :          0 : int set_extent_defrag(struct extent_io_tree *tree, u64 start, u64 end,
    1218                 :            :                       struct extent_state **cached_state, gfp_t mask)
    1219                 :            : {
    1220                 :          0 :         return set_extent_bit(tree, start, end,
    1221                 :            :                               EXTENT_DELALLOC | EXTENT_UPTODATE | EXTENT_DEFRAG,
    1222                 :            :                               NULL, cached_state, mask);
    1223                 :            : }
    1224                 :            : 
    1225                 :          0 : int clear_extent_dirty(struct extent_io_tree *tree, u64 start, u64 end,
    1226                 :            :                        gfp_t mask)
    1227                 :            : {
    1228                 :          0 :         return clear_extent_bit(tree, start, end,
    1229                 :            :                                 EXTENT_DIRTY | EXTENT_DELALLOC |
    1230                 :            :                                 EXTENT_DO_ACCOUNTING, 0, 0, NULL, mask);
    1231                 :            : }
    1232                 :            : 
    1233                 :          0 : int set_extent_new(struct extent_io_tree *tree, u64 start, u64 end,
    1234                 :            :                      gfp_t mask)
    1235                 :            : {
    1236                 :          0 :         return set_extent_bit(tree, start, end, EXTENT_NEW, NULL,
    1237                 :            :                               NULL, mask);
    1238                 :            : }
    1239                 :            : 
    1240                 :          0 : int set_extent_uptodate(struct extent_io_tree *tree, u64 start, u64 end,
    1241                 :            :                         struct extent_state **cached_state, gfp_t mask)
    1242                 :            : {
    1243                 :          0 :         return set_extent_bit(tree, start, end, EXTENT_UPTODATE, NULL,
    1244                 :            :                               cached_state, mask);
    1245                 :            : }
    1246                 :            : 
    1247                 :          0 : int clear_extent_uptodate(struct extent_io_tree *tree, u64 start, u64 end,
    1248                 :            :                           struct extent_state **cached_state, gfp_t mask)
    1249                 :            : {
    1250                 :          0 :         return clear_extent_bit(tree, start, end, EXTENT_UPTODATE, 0, 0,
    1251                 :            :                                 cached_state, mask);
    1252                 :            : }
    1253                 :            : 
    1254                 :            : /*
    1255                 :            :  * either insert or lock state struct between start and end use mask to tell
    1256                 :            :  * us if waiting is desired.
    1257                 :            :  */
    1258                 :          0 : int lock_extent_bits(struct extent_io_tree *tree, u64 start, u64 end,
    1259                 :            :                      unsigned long bits, struct extent_state **cached_state)
    1260                 :            : {
    1261                 :            :         int err;
    1262                 :            :         u64 failed_start;
    1263                 :            :         while (1) {
    1264                 :          0 :                 err = __set_extent_bit(tree, start, end, EXTENT_LOCKED | bits,
    1265                 :            :                                        EXTENT_LOCKED, &failed_start,
    1266                 :            :                                        cached_state, GFP_NOFS);
    1267         [ #  # ]:          0 :                 if (err == -EEXIST) {
    1268                 :          0 :                         wait_extent_bit(tree, failed_start, end, EXTENT_LOCKED);
    1269                 :          0 :                         start = failed_start;
    1270                 :            :                 } else
    1271                 :            :                         break;
    1272         [ #  # ]:          0 :                 WARN_ON(start > end);
    1273                 :            :         }
    1274                 :          0 :         return err;
    1275                 :            : }
    1276                 :            : 
    1277                 :          0 : int lock_extent(struct extent_io_tree *tree, u64 start, u64 end)
    1278                 :            : {
    1279                 :          0 :         return lock_extent_bits(tree, start, end, 0, NULL);
    1280                 :            : }
    1281                 :            : 
    1282                 :          0 : int try_lock_extent(struct extent_io_tree *tree, u64 start, u64 end)
    1283                 :            : {
    1284                 :            :         int err;
    1285                 :            :         u64 failed_start;
    1286                 :            : 
    1287                 :          0 :         err = __set_extent_bit(tree, start, end, EXTENT_LOCKED, EXTENT_LOCKED,
    1288                 :            :                                &failed_start, NULL, GFP_NOFS);
    1289         [ #  # ]:          0 :         if (err == -EEXIST) {
    1290         [ #  # ]:          0 :                 if (failed_start > start)
    1291                 :          0 :                         clear_extent_bit(tree, start, failed_start - 1,
    1292                 :            :                                          EXTENT_LOCKED, 1, 0, NULL, GFP_NOFS);
    1293                 :            :                 return 0;
    1294                 :            :         }
    1295                 :            :         return 1;
    1296                 :            : }
    1297                 :            : 
    1298                 :          0 : int unlock_extent_cached(struct extent_io_tree *tree, u64 start, u64 end,
    1299                 :            :                          struct extent_state **cached, gfp_t mask)
    1300                 :            : {
    1301                 :          0 :         return clear_extent_bit(tree, start, end, EXTENT_LOCKED, 1, 0, cached,
    1302                 :            :                                 mask);
    1303                 :            : }
    1304                 :            : 
    1305                 :          0 : int unlock_extent(struct extent_io_tree *tree, u64 start, u64 end)
    1306                 :            : {
    1307                 :          0 :         return clear_extent_bit(tree, start, end, EXTENT_LOCKED, 1, 0, NULL,
    1308                 :            :                                 GFP_NOFS);
    1309                 :            : }
    1310                 :            : 
    1311                 :          0 : int extent_range_clear_dirty_for_io(struct inode *inode, u64 start, u64 end)
    1312                 :            : {
    1313                 :          0 :         unsigned long index = start >> PAGE_CACHE_SHIFT;
    1314                 :          0 :         unsigned long end_index = end >> PAGE_CACHE_SHIFT;
    1315                 :            :         struct page *page;
    1316                 :            : 
    1317         [ #  # ]:          0 :         while (index <= end_index) {
    1318                 :          0 :                 page = find_get_page(inode->i_mapping, index);
    1319         [ #  # ]:          0 :                 BUG_ON(!page); /* Pages should be in the extent_io_tree */
    1320                 :          0 :                 clear_page_dirty_for_io(page);
    1321                 :          0 :                 page_cache_release(page);
    1322                 :          0 :                 index++;
    1323                 :            :         }
    1324                 :          0 :         return 0;
    1325                 :            : }
    1326                 :            : 
    1327                 :          0 : int extent_range_redirty_for_io(struct inode *inode, u64 start, u64 end)
    1328                 :            : {
    1329                 :          0 :         unsigned long index = start >> PAGE_CACHE_SHIFT;
    1330                 :          0 :         unsigned long end_index = end >> PAGE_CACHE_SHIFT;
    1331                 :            :         struct page *page;
    1332                 :            : 
    1333         [ #  # ]:          0 :         while (index <= end_index) {
    1334                 :          0 :                 page = find_get_page(inode->i_mapping, index);
    1335         [ #  # ]:          0 :                 BUG_ON(!page); /* Pages should be in the extent_io_tree */
    1336                 :          0 :                 account_page_redirty(page);
    1337                 :          0 :                 __set_page_dirty_nobuffers(page);
    1338                 :          0 :                 page_cache_release(page);
    1339                 :          0 :                 index++;
    1340                 :            :         }
    1341                 :          0 :         return 0;
    1342                 :            : }
    1343                 :            : 
    1344                 :            : /*
    1345                 :            :  * helper function to set both pages and extents in the tree writeback
    1346                 :            :  */
    1347                 :          0 : static int set_range_writeback(struct extent_io_tree *tree, u64 start, u64 end)
    1348                 :            : {
    1349                 :          0 :         unsigned long index = start >> PAGE_CACHE_SHIFT;
    1350                 :          0 :         unsigned long end_index = end >> PAGE_CACHE_SHIFT;
    1351                 :            :         struct page *page;
    1352                 :            : 
    1353         [ #  # ]:          0 :         while (index <= end_index) {
    1354                 :          0 :                 page = find_get_page(tree->mapping, index);
    1355         [ #  # ]:          0 :                 BUG_ON(!page); /* Pages should be in the extent_io_tree */
    1356                 :            :                 set_page_writeback(page);
    1357                 :          0 :                 page_cache_release(page);
    1358                 :          0 :                 index++;
    1359                 :            :         }
    1360                 :          0 :         return 0;
    1361                 :            : }
    1362                 :            : 
    1363                 :            : /* find the first state struct with 'bits' set after 'start', and
    1364                 :            :  * return it.  tree->lock must be held.  NULL will returned if
    1365                 :            :  * nothing was found after 'start'
    1366                 :            :  */
    1367                 :            : static struct extent_state *
    1368                 :          0 : find_first_extent_bit_state(struct extent_io_tree *tree,
    1369                 :            :                             u64 start, unsigned long bits)
    1370                 :            : {
    1371                 :            :         struct rb_node *node;
    1372                 :            :         struct extent_state *state;
    1373                 :            : 
    1374                 :            :         /*
    1375                 :            :          * this search will find all the extents that end after
    1376                 :            :          * our range starts.
    1377                 :            :          */
    1378                 :            :         node = tree_search(tree, start);
    1379         [ #  # ]:          0 :         if (!node)
    1380                 :            :                 goto out;
    1381                 :            : 
    1382                 :            :         while (1) {
    1383                 :          0 :                 state = rb_entry(node, struct extent_state, rb_node);
    1384 [ #  # ][ #  # ]:          0 :                 if (state->end >= start && (state->state & bits))
    1385                 :            :                         return state;
    1386                 :            : 
    1387                 :          0 :                 node = rb_next(node);
    1388         [ #  # ]:          0 :                 if (!node)
    1389                 :            :                         break;
    1390                 :            :         }
    1391                 :            : out:
    1392                 :            :         return NULL;
    1393                 :            : }
    1394                 :            : 
    1395                 :            : /*
    1396                 :            :  * find the first offset in the io tree with 'bits' set. zero is
    1397                 :            :  * returned if we find something, and *start_ret and *end_ret are
    1398                 :            :  * set to reflect the state struct that was found.
    1399                 :            :  *
    1400                 :            :  * If nothing was found, 1 is returned. If found something, return 0.
    1401                 :            :  */
    1402                 :          0 : int find_first_extent_bit(struct extent_io_tree *tree, u64 start,
    1403                 :            :                           u64 *start_ret, u64 *end_ret, unsigned long bits,
    1404                 :            :                           struct extent_state **cached_state)
    1405                 :            : {
    1406                 :            :         struct extent_state *state;
    1407                 :            :         struct rb_node *n;
    1408                 :            :         int ret = 1;
    1409                 :            : 
    1410                 :            :         spin_lock(&tree->lock);
    1411 [ #  # ][ #  # ]:          0 :         if (cached_state && *cached_state) {
    1412                 :            :                 state = *cached_state;
    1413 [ #  # ][ #  # ]:          0 :                 if (state->end == start - 1 && state->tree) {
    1414                 :          0 :                         n = rb_next(&state->rb_node);
    1415         [ #  # ]:          0 :                         while (n) {
    1416                 :          0 :                                 state = rb_entry(n, struct extent_state,
    1417                 :            :                                                  rb_node);
    1418         [ #  # ]:          0 :                                 if (state->state & bits)
    1419                 :            :                                         goto got_it;
    1420                 :          0 :                                 n = rb_next(n);
    1421                 :            :                         }
    1422                 :          0 :                         free_extent_state(*cached_state);
    1423                 :          0 :                         *cached_state = NULL;
    1424                 :          0 :                         goto out;
    1425                 :            :                 }
    1426                 :          0 :                 free_extent_state(*cached_state);
    1427                 :          0 :                 *cached_state = NULL;
    1428                 :            :         }
    1429                 :            : 
    1430                 :          0 :         state = find_first_extent_bit_state(tree, start, bits);
    1431                 :            : got_it:
    1432         [ #  # ]:          0 :         if (state) {
    1433                 :          0 :                 cache_state(state, cached_state);
    1434                 :          0 :                 *start_ret = state->start;
    1435                 :          0 :                 *end_ret = state->end;
    1436                 :            :                 ret = 0;
    1437                 :            :         }
    1438                 :            : out:
    1439                 :            :         spin_unlock(&tree->lock);
    1440                 :          0 :         return ret;
    1441                 :            : }
    1442                 :            : 
    1443                 :            : /*
    1444                 :            :  * find a contiguous range of bytes in the file marked as delalloc, not
    1445                 :            :  * more than 'max_bytes'.  start and end are used to return the range,
    1446                 :            :  *
    1447                 :            :  * 1 is returned if we find something, 0 if nothing was in the tree
    1448                 :            :  */
    1449                 :          0 : static noinline u64 find_delalloc_range(struct extent_io_tree *tree,
    1450                 :            :                                         u64 *start, u64 *end, u64 max_bytes,
    1451                 :            :                                         struct extent_state **cached_state)
    1452                 :            : {
    1453                 :            :         struct rb_node *node;
    1454                 :            :         struct extent_state *state;
    1455                 :          0 :         u64 cur_start = *start;
    1456                 :            :         u64 found = 0;
    1457                 :            :         u64 total_bytes = 0;
    1458                 :            : 
    1459                 :            :         spin_lock(&tree->lock);
    1460                 :            : 
    1461                 :            :         /*
    1462                 :            :          * this search will find all the extents that end after
    1463                 :            :          * our range starts.
    1464                 :            :          */
    1465                 :            :         node = tree_search(tree, cur_start);
    1466         [ #  # ]:          0 :         if (!node) {
    1467                 :            :                 if (!found)
    1468                 :          0 :                         *end = (u64)-1;
    1469                 :            :                 goto out;
    1470                 :            :         }
    1471                 :            : 
    1472                 :            :         while (1) {
    1473                 :          0 :                 state = rb_entry(node, struct extent_state, rb_node);
    1474 [ #  # ][ #  # ]:          0 :                 if (found && (state->start != cur_start ||
                 [ #  # ]
    1475                 :          0 :                               (state->state & EXTENT_BOUNDARY))) {
    1476                 :            :                         goto out;
    1477                 :            :                 }
    1478         [ #  # ]:          0 :                 if (!(state->state & EXTENT_DELALLOC)) {
    1479         [ #  # ]:          0 :                         if (!found)
    1480                 :          0 :                                 *end = state->end;
    1481                 :            :                         goto out;
    1482                 :            :                 }
    1483         [ #  # ]:          0 :                 if (!found) {
    1484                 :          0 :                         *start = state->start;
    1485                 :          0 :                         *cached_state = state;
    1486                 :          0 :                         atomic_inc(&state->refs);
    1487                 :            :                 }
    1488                 :          0 :                 found++;
    1489                 :          0 :                 *end = state->end;
    1490                 :          0 :                 cur_start = state->end + 1;
    1491                 :          0 :                 node = rb_next(node);
    1492                 :          0 :                 total_bytes += state->end - state->start + 1;
    1493         [ #  # ]:          0 :                 if (total_bytes >= max_bytes)
    1494                 :            :                         break;
    1495         [ #  # ]:          0 :                 if (!node)
    1496                 :            :                         break;
    1497                 :            :         }
    1498                 :            : out:
    1499                 :            :         spin_unlock(&tree->lock);
    1500                 :          0 :         return found;
    1501                 :            : }
    1502                 :            : 
    1503                 :          0 : static noinline void __unlock_for_delalloc(struct inode *inode,
    1504                 :            :                                            struct page *locked_page,
    1505                 :            :                                            u64 start, u64 end)
    1506                 :            : {
    1507                 :            :         int ret;
    1508                 :            :         struct page *pages[16];
    1509                 :          0 :         unsigned long index = start >> PAGE_CACHE_SHIFT;
    1510                 :          0 :         unsigned long end_index = end >> PAGE_CACHE_SHIFT;
    1511                 :          0 :         unsigned long nr_pages = end_index - index + 1;
    1512                 :            :         int i;
    1513                 :            : 
    1514 [ #  # ][ #  # ]:          0 :         if (index == locked_page->index && end_index == index)
    1515                 :          0 :                 return;
    1516                 :            : 
    1517         [ #  # ]:          0 :         while (nr_pages > 0) {
    1518                 :          0 :                 ret = find_get_pages_contig(inode->i_mapping, index,
    1519                 :          0 :                                      min_t(unsigned long, nr_pages,
    1520                 :            :                                      ARRAY_SIZE(pages)), pages);
    1521         [ #  # ]:          0 :                 for (i = 0; i < ret; i++) {
    1522         [ #  # ]:          0 :                         if (pages[i] != locked_page)
    1523                 :          0 :                                 unlock_page(pages[i]);
    1524                 :          0 :                         page_cache_release(pages[i]);
    1525                 :            :                 }
    1526                 :          0 :                 nr_pages -= ret;
    1527                 :          0 :                 index += ret;
    1528                 :          0 :                 cond_resched();
    1529                 :            :         }
    1530                 :            : }
    1531                 :            : 
    1532                 :          0 : static noinline int lock_delalloc_pages(struct inode *inode,
    1533                 :            :                                         struct page *locked_page,
    1534                 :            :                                         u64 delalloc_start,
    1535                 :            :                                         u64 delalloc_end)
    1536                 :            : {
    1537                 :          0 :         unsigned long index = delalloc_start >> PAGE_CACHE_SHIFT;
    1538                 :            :         unsigned long start_index = index;
    1539                 :          0 :         unsigned long end_index = delalloc_end >> PAGE_CACHE_SHIFT;
    1540                 :            :         unsigned long pages_locked = 0;
    1541                 :            :         struct page *pages[16];
    1542                 :            :         unsigned long nrpages;
    1543                 :            :         int ret;
    1544                 :            :         int i;
    1545                 :            : 
    1546                 :            :         /* the caller is responsible for locking the start index */
    1547 [ #  # ][ #  # ]:          0 :         if (index == locked_page->index && index == end_index)
    1548                 :            :                 return 0;
    1549                 :            : 
    1550                 :            :         /* skip the page at the start index */
    1551                 :          0 :         nrpages = end_index - index + 1;
    1552         [ #  # ]:          0 :         while (nrpages > 0) {
    1553                 :          0 :                 ret = find_get_pages_contig(inode->i_mapping, index,
    1554                 :          0 :                                      min_t(unsigned long,
    1555                 :            :                                      nrpages, ARRAY_SIZE(pages)), pages);
    1556         [ #  # ]:          0 :                 if (ret == 0) {
    1557                 :            :                         ret = -EAGAIN;
    1558                 :            :                         goto done;
    1559                 :            :                 }
    1560                 :            :                 /* now we have an array of pages, lock them all */
    1561         [ #  # ]:          0 :                 for (i = 0; i < ret; i++) {
    1562                 :            :                         /*
    1563                 :            :                          * the caller is taking responsibility for
    1564                 :            :                          * locked_page
    1565                 :            :                          */
    1566         [ #  # ]:          0 :                         if (pages[i] != locked_page) {
    1567                 :            :                                 lock_page(pages[i]);
    1568 [ #  # ][ #  # ]:          0 :                                 if (!PageDirty(pages[i]) ||
    1569                 :          0 :                                     pages[i]->mapping != inode->i_mapping) {
    1570                 :            :                                         ret = -EAGAIN;
    1571                 :          0 :                                         unlock_page(pages[i]);
    1572                 :          0 :                                         page_cache_release(pages[i]);
    1573                 :          0 :                                         goto done;
    1574                 :            :                                 }
    1575                 :            :                         }
    1576                 :          0 :                         page_cache_release(pages[i]);
    1577                 :          0 :                         pages_locked++;
    1578                 :            :                 }
    1579                 :          0 :                 nrpages -= ret;
    1580                 :          0 :                 index += ret;
    1581                 :          0 :                 cond_resched();
    1582                 :            :         }
    1583                 :            :         ret = 0;
    1584                 :            : done:
    1585         [ #  # ]:          0 :         if (ret && pages_locked) {
    1586                 :          0 :                 __unlock_for_delalloc(inode, locked_page,
    1587                 :            :                               delalloc_start,
    1588                 :          0 :                               ((u64)(start_index + pages_locked - 1)) <<
    1589                 :            :                               PAGE_CACHE_SHIFT);
    1590                 :            :         }
    1591                 :          0 :         return ret;
    1592                 :            : }
    1593                 :            : 
    1594                 :            : /*
    1595                 :            :  * find a contiguous range of bytes in the file marked as delalloc, not
    1596                 :            :  * more than 'max_bytes'.  start and end are used to return the range,
    1597                 :            :  *
    1598                 :            :  * 1 is returned if we find something, 0 if nothing was in the tree
    1599                 :            :  */
    1600                 :          0 : STATIC u64 find_lock_delalloc_range(struct inode *inode,
    1601                 :            :                                     struct extent_io_tree *tree,
    1602                 :            :                                     struct page *locked_page, u64 *start,
    1603                 :            :                                     u64 *end, u64 max_bytes)
    1604                 :            : {
    1605                 :            :         u64 delalloc_start;
    1606                 :            :         u64 delalloc_end;
    1607                 :            :         u64 found;
    1608                 :          0 :         struct extent_state *cached_state = NULL;
    1609                 :            :         int ret;
    1610                 :            :         int loops = 0;
    1611                 :            : 
    1612                 :            : again:
    1613                 :            :         /* step one, find a bunch of delalloc bytes starting at start */
    1614                 :          0 :         delalloc_start = *start;
    1615                 :          0 :         delalloc_end = 0;
    1616                 :          0 :         found = find_delalloc_range(tree, &delalloc_start, &delalloc_end,
    1617                 :            :                                     max_bytes, &cached_state);
    1618 [ #  # ][ #  # ]:          0 :         if (!found || delalloc_end <= *start) {
    1619                 :          0 :                 *start = delalloc_start;
    1620                 :          0 :                 *end = delalloc_end;
    1621                 :          0 :                 free_extent_state(cached_state);
    1622                 :          0 :                 return 0;
    1623                 :            :         }
    1624                 :            : 
    1625                 :            :         /*
    1626                 :            :          * start comes from the offset of locked_page.  We have to lock
    1627                 :            :          * pages in order, so we can't process delalloc bytes before
    1628                 :            :          * locked_page
    1629                 :            :          */
    1630         [ #  # ]:          0 :         if (delalloc_start < *start)
    1631                 :          0 :                 delalloc_start = *start;
    1632                 :            : 
    1633                 :            :         /*
    1634                 :            :          * make sure to limit the number of pages we try to lock down
    1635                 :            :          */
    1636         [ #  # ]:          0 :         if (delalloc_end + 1 - delalloc_start > max_bytes)
    1637                 :          0 :                 delalloc_end = delalloc_start + max_bytes - 1;
    1638                 :            : 
    1639                 :            :         /* step two, lock all the pages after the page that has start */
    1640                 :          0 :         ret = lock_delalloc_pages(inode, locked_page,
    1641                 :            :                                   delalloc_start, delalloc_end);
    1642         [ #  # ]:          0 :         if (ret == -EAGAIN) {
    1643                 :            :                 /* some of the pages are gone, lets avoid looping by
    1644                 :            :                  * shortening the size of the delalloc range we're searching
    1645                 :            :                  */
    1646                 :          0 :                 free_extent_state(cached_state);
    1647         [ #  # ]:          0 :                 if (!loops) {
    1648                 :            :                         max_bytes = PAGE_CACHE_SIZE;
    1649                 :            :                         loops = 1;
    1650                 :            :                         goto again;
    1651                 :            :                 } else {
    1652                 :            :                         found = 0;
    1653                 :            :                         goto out_failed;
    1654                 :            :                 }
    1655                 :            :         }
    1656         [ #  # ]:          0 :         BUG_ON(ret); /* Only valid values are 0 and -EAGAIN */
    1657                 :            : 
    1658                 :            :         /* step three, lock the state bits for the whole range */
    1659                 :          0 :         lock_extent_bits(tree, delalloc_start, delalloc_end, 0, &cached_state);
    1660                 :            : 
    1661                 :            :         /* then test to make sure it is all still delalloc */
    1662                 :          0 :         ret = test_range_bit(tree, delalloc_start, delalloc_end,
    1663                 :            :                              EXTENT_DELALLOC, 1, cached_state);
    1664         [ #  # ]:          0 :         if (!ret) {
    1665                 :          0 :                 unlock_extent_cached(tree, delalloc_start, delalloc_end,
    1666                 :            :                                      &cached_state, GFP_NOFS);
    1667                 :          0 :                 __unlock_for_delalloc(inode, locked_page,
    1668                 :            :                               delalloc_start, delalloc_end);
    1669                 :          0 :                 cond_resched();
    1670                 :          0 :                 goto again;
    1671                 :            :         }
    1672                 :          0 :         free_extent_state(cached_state);
    1673                 :          0 :         *start = delalloc_start;
    1674                 :          0 :         *end = delalloc_end;
    1675                 :            : out_failed:
    1676                 :          0 :         return found;
    1677                 :            : }
    1678                 :            : 
    1679                 :          0 : int extent_clear_unlock_delalloc(struct inode *inode, u64 start, u64 end,
    1680                 :            :                                  struct page *locked_page,
    1681                 :            :                                  unsigned long clear_bits,
    1682                 :            :                                  unsigned long page_ops)
    1683                 :            : {
    1684                 :          0 :         struct extent_io_tree *tree = &BTRFS_I(inode)->io_tree;
    1685                 :            :         int ret;
    1686                 :            :         struct page *pages[16];
    1687                 :          0 :         unsigned long index = start >> PAGE_CACHE_SHIFT;
    1688                 :          0 :         unsigned long end_index = end >> PAGE_CACHE_SHIFT;
    1689                 :          0 :         unsigned long nr_pages = end_index - index + 1;
    1690                 :            :         int i;
    1691                 :            : 
    1692                 :          0 :         clear_extent_bit(tree, start, end, clear_bits, 1, 0, NULL, GFP_NOFS);
    1693         [ #  # ]:          0 :         if (page_ops == 0)
    1694                 :            :                 return 0;
    1695                 :            : 
    1696         [ #  # ]:          0 :         while (nr_pages > 0) {
    1697                 :          0 :                 ret = find_get_pages_contig(inode->i_mapping, index,
    1698                 :          0 :                                      min_t(unsigned long,
    1699                 :            :                                      nr_pages, ARRAY_SIZE(pages)), pages);
    1700         [ #  # ]:          0 :                 for (i = 0; i < ret; i++) {
    1701                 :            : 
    1702         [ #  # ]:          0 :                         if (page_ops & PAGE_SET_PRIVATE2)
    1703                 :          0 :                                 SetPagePrivate2(pages[i]);
    1704                 :            : 
    1705         [ #  # ]:          0 :                         if (pages[i] == locked_page) {
    1706                 :          0 :                                 page_cache_release(pages[i]);
    1707                 :          0 :                                 continue;
    1708                 :            :                         }
    1709         [ #  # ]:          0 :                         if (page_ops & PAGE_CLEAR_DIRTY)
    1710                 :          0 :                                 clear_page_dirty_for_io(pages[i]);
    1711         [ #  # ]:          0 :                         if (page_ops & PAGE_SET_WRITEBACK)
    1712                 :          0 :                                 set_page_writeback(pages[i]);
    1713         [ #  # ]:          0 :                         if (page_ops & PAGE_END_WRITEBACK)
    1714                 :          0 :                                 end_page_writeback(pages[i]);
    1715         [ #  # ]:          0 :                         if (page_ops & PAGE_UNLOCK)
    1716                 :          0 :                                 unlock_page(pages[i]);
    1717                 :          0 :                         page_cache_release(pages[i]);
    1718                 :            :                 }
    1719                 :          0 :                 nr_pages -= ret;
    1720                 :          0 :                 index += ret;
    1721                 :          0 :                 cond_resched();
    1722                 :            :         }
    1723                 :            :         return 0;
    1724                 :            : }
    1725                 :            : 
    1726                 :            : /*
    1727                 :            :  * count the number of bytes in the tree that have a given bit(s)
    1728                 :            :  * set.  This can be fairly slow, except for EXTENT_DIRTY which is
    1729                 :            :  * cached.  The total number found is returned.
    1730                 :            :  */
    1731                 :          0 : u64 count_range_bits(struct extent_io_tree *tree,
    1732                 :            :                      u64 *start, u64 search_end, u64 max_bytes,
    1733                 :            :                      unsigned long bits, int contig)
    1734                 :            : {
    1735                 :            :         struct rb_node *node;
    1736                 :            :         struct extent_state *state;
    1737                 :          0 :         u64 cur_start = *start;
    1738                 :            :         u64 total_bytes = 0;
    1739                 :            :         u64 last = 0;
    1740                 :            :         int found = 0;
    1741                 :            : 
    1742 [ #  # ][ #  # ]:          0 :         if (WARN_ON(search_end <= cur_start))
    1743                 :            :                 return 0;
    1744                 :            : 
    1745                 :            :         spin_lock(&tree->lock);
    1746         [ #  # ]:          0 :         if (cur_start == 0 && bits == EXTENT_DIRTY) {
    1747                 :          0 :                 total_bytes = tree->dirty_bytes;
    1748                 :          0 :                 goto out;
    1749                 :            :         }
    1750                 :            :         /*
    1751                 :            :          * this search will find all the extents that end after
    1752                 :            :          * our range starts.
    1753                 :            :          */
    1754                 :            :         node = tree_search(tree, cur_start);
    1755         [ #  # ]:          0 :         if (!node)
    1756                 :            :                 goto out;
    1757                 :            : 
    1758                 :            :         while (1) {
    1759                 :            :                 state = rb_entry(node, struct extent_state, rb_node);
    1760         [ #  # ]:          0 :                 if (state->start > search_end)
    1761                 :            :                         break;
    1762 [ #  # ][ #  # ]:          0 :                 if (contig && found && state->start > last + 1)
    1763                 :            :                         break;
    1764 [ #  # ][ #  # ]:          0 :                 if (state->end >= cur_start && (state->state & bits) == bits) {
    1765                 :          0 :                         total_bytes += min(search_end, state->end) + 1 -
    1766                 :          0 :                                        max(cur_start, state->start);
    1767         [ #  # ]:          0 :                         if (total_bytes >= max_bytes)
    1768                 :            :                                 break;
    1769         [ #  # ]:          0 :                         if (!found) {
    1770                 :          0 :                                 *start = max(cur_start, state->start);
    1771                 :            :                                 found = 1;
    1772                 :            :                         }
    1773                 :          0 :                         last = state->end;
    1774         [ #  # ]:          0 :                 } else if (contig && found) {
    1775                 :            :                         break;
    1776                 :            :                 }
    1777                 :          0 :                 node = rb_next(node);
    1778         [ #  # ]:          0 :                 if (!node)
    1779                 :            :                         break;
    1780                 :            :         }
    1781                 :            : out:
    1782                 :            :         spin_unlock(&tree->lock);
    1783                 :          0 :         return total_bytes;
    1784                 :            : }
    1785                 :            : 
    1786                 :            : /*
    1787                 :            :  * set the private field for a given byte offset in the tree.  If there isn't
    1788                 :            :  * an extent_state there already, this does nothing.
    1789                 :            :  */
    1790                 :          0 : static int set_state_private(struct extent_io_tree *tree, u64 start, u64 private)
    1791                 :            : {
    1792                 :            :         struct rb_node *node;
    1793                 :            :         struct extent_state *state;
    1794                 :            :         int ret = 0;
    1795                 :            : 
    1796                 :            :         spin_lock(&tree->lock);
    1797                 :            :         /*
    1798                 :            :          * this search will find all the extents that end after
    1799                 :            :          * our range starts.
    1800                 :            :          */
    1801                 :            :         node = tree_search(tree, start);
    1802         [ #  # ]:          0 :         if (!node) {
    1803                 :            :                 ret = -ENOENT;
    1804                 :            :                 goto out;
    1805                 :            :         }
    1806                 :            :         state = rb_entry(node, struct extent_state, rb_node);
    1807         [ #  # ]:          0 :         if (state->start != start) {
    1808                 :            :                 ret = -ENOENT;
    1809                 :            :                 goto out;
    1810                 :            :         }
    1811                 :          0 :         state->private = private;
    1812                 :            : out:
    1813                 :            :         spin_unlock(&tree->lock);
    1814                 :          0 :         return ret;
    1815                 :            : }
    1816                 :            : 
    1817                 :          0 : int get_state_private(struct extent_io_tree *tree, u64 start, u64 *private)
    1818                 :            : {
    1819                 :            :         struct rb_node *node;
    1820                 :            :         struct extent_state *state;
    1821                 :            :         int ret = 0;
    1822                 :            : 
    1823                 :            :         spin_lock(&tree->lock);
    1824                 :            :         /*
    1825                 :            :          * this search will find all the extents that end after
    1826                 :            :          * our range starts.
    1827                 :            :          */
    1828                 :            :         node = tree_search(tree, start);
    1829         [ #  # ]:          0 :         if (!node) {
    1830                 :            :                 ret = -ENOENT;
    1831                 :            :                 goto out;
    1832                 :            :         }
    1833                 :            :         state = rb_entry(node, struct extent_state, rb_node);
    1834         [ #  # ]:          0 :         if (state->start != start) {
    1835                 :            :                 ret = -ENOENT;
    1836                 :            :                 goto out;
    1837                 :            :         }
    1838                 :          0 :         *private = state->private;
    1839                 :            : out:
    1840                 :            :         spin_unlock(&tree->lock);
    1841                 :          0 :         return ret;
    1842                 :            : }
    1843                 :            : 
    1844                 :            : /*
    1845                 :            :  * searches a range in the state tree for a given mask.
    1846                 :            :  * If 'filled' == 1, this returns 1 only if every extent in the tree
    1847                 :            :  * has the bits set.  Otherwise, 1 is returned if any bit in the
    1848                 :            :  * range is found set.
    1849                 :            :  */
    1850                 :          0 : int test_range_bit(struct extent_io_tree *tree, u64 start, u64 end,
    1851                 :            :                    unsigned long bits, int filled, struct extent_state *cached)
    1852                 :            : {
    1853                 :            :         struct extent_state *state = NULL;
    1854                 :            :         struct rb_node *node;
    1855                 :            :         int bitset = 0;
    1856                 :            : 
    1857                 :            :         spin_lock(&tree->lock);
    1858 [ #  # ][ #  # ]:          0 :         if (cached && cached->tree && cached->start <= start &&
         [ #  # ][ #  # ]
    1859                 :          0 :             cached->end > start)
    1860                 :          0 :                 node = &cached->rb_node;
    1861                 :            :         else
    1862                 :            :                 node = tree_search(tree, start);
    1863         [ #  # ]:          0 :         while (node && start <= end) {
    1864                 :            :                 state = rb_entry(node, struct extent_state, rb_node);
    1865                 :            : 
    1866 [ #  # ][ #  # ]:          0 :                 if (filled && state->start > start) {
    1867                 :            :                         bitset = 0;
    1868                 :            :                         break;
    1869                 :            :                 }
    1870                 :            : 
    1871         [ #  # ]:          0 :                 if (state->start > end)
    1872                 :            :                         break;
    1873                 :            : 
    1874         [ #  # ]:          0 :                 if (state->state & bits) {
    1875                 :            :                         bitset = 1;
    1876         [ #  # ]:          0 :                         if (!filled)
    1877                 :            :                                 break;
    1878         [ #  # ]:          0 :                 } else if (filled) {
    1879                 :            :                         bitset = 0;
    1880                 :            :                         break;
    1881                 :            :                 }
    1882                 :            : 
    1883         [ #  # ]:          0 :                 if (state->end == (u64)-1)
    1884                 :            :                         break;
    1885                 :            : 
    1886                 :          0 :                 start = state->end + 1;
    1887         [ #  # ]:          0 :                 if (start > end)
    1888                 :            :                         break;
    1889                 :          0 :                 node = rb_next(node);
    1890         [ #  # ]:          0 :                 if (!node) {
    1891         [ #  # ]:          0 :                         if (filled)
    1892                 :            :                                 bitset = 0;
    1893                 :            :                         break;
    1894                 :            :                 }
    1895                 :            :         }
    1896                 :            :         spin_unlock(&tree->lock);
    1897                 :          0 :         return bitset;
    1898                 :            : }
    1899                 :            : 
    1900                 :            : /*
    1901                 :            :  * helper function to set a given page up to date if all the
    1902                 :            :  * extents in the tree for that page are up to date
    1903                 :            :  */
    1904                 :          0 : static void check_page_uptodate(struct extent_io_tree *tree, struct page *page)
    1905                 :            : {
    1906                 :          0 :         u64 start = page_offset(page);
    1907                 :          0 :         u64 end = start + PAGE_CACHE_SIZE - 1;
    1908         [ #  # ]:          0 :         if (test_range_bit(tree, start, end, EXTENT_UPTODATE, 1, NULL))
    1909                 :            :                 SetPageUptodate(page);
    1910                 :          0 : }
    1911                 :            : 
    1912                 :            : /*
    1913                 :            :  * When IO fails, either with EIO or csum verification fails, we
    1914                 :            :  * try other mirrors that might have a good copy of the data.  This
    1915                 :            :  * io_failure_record is used to record state as we go through all the
    1916                 :            :  * mirrors.  If another mirror has good data, the page is set up to date
    1917                 :            :  * and things continue.  If a good mirror can't be found, the original
    1918                 :            :  * bio end_io callback is called to indicate things have failed.
    1919                 :            :  */
    1920                 :            : struct io_failure_record {
    1921                 :            :         struct page *page;
    1922                 :            :         u64 start;
    1923                 :            :         u64 len;
    1924                 :            :         u64 logical;
    1925                 :            :         unsigned long bio_flags;
    1926                 :            :         int this_mirror;
    1927                 :            :         int failed_mirror;
    1928                 :            :         int in_validation;
    1929                 :            : };
    1930                 :            : 
    1931                 :          0 : static int free_io_failure(struct inode *inode, struct io_failure_record *rec,
    1932                 :            :                                 int did_repair)
    1933                 :            : {
    1934                 :            :         int ret;
    1935                 :            :         int err = 0;
    1936                 :          0 :         struct extent_io_tree *failure_tree = &BTRFS_I(inode)->io_failure_tree;
    1937                 :            : 
    1938                 :          0 :         set_state_private(failure_tree, rec->start, 0);
    1939                 :          0 :         ret = clear_extent_bits(failure_tree, rec->start,
    1940                 :          0 :                                 rec->start + rec->len - 1,
    1941                 :            :                                 EXTENT_LOCKED | EXTENT_DIRTY, GFP_NOFS);
    1942         [ #  # ]:          0 :         if (ret)
    1943                 :            :                 err = ret;
    1944                 :            : 
    1945                 :          0 :         ret = clear_extent_bits(&BTRFS_I(inode)->io_tree, rec->start,
    1946                 :          0 :                                 rec->start + rec->len - 1,
    1947                 :            :                                 EXTENT_DAMAGED, GFP_NOFS);
    1948         [ #  # ]:          0 :         if (ret && !err)
    1949                 :            :                 err = ret;
    1950                 :            : 
    1951                 :          0 :         kfree(rec);
    1952                 :          0 :         return err;
    1953                 :            : }
    1954                 :            : 
    1955                 :            : /*
    1956                 :            :  * this bypasses the standard btrfs submit functions deliberately, as
    1957                 :            :  * the standard behavior is to write all copies in a raid setup. here we only
    1958                 :            :  * want to write the one bad copy. so we do the mapping for ourselves and issue
    1959                 :            :  * submit_bio directly.
    1960                 :            :  * to avoid any synchronization issues, wait for the data after writing, which
    1961                 :            :  * actually prevents the read that triggered the error from finishing.
    1962                 :            :  * currently, there can be no more than two copies of every data bit. thus,
    1963                 :            :  * exactly one rewrite is required.
    1964                 :            :  */
    1965                 :          0 : int repair_io_failure(struct btrfs_fs_info *fs_info, u64 start,
    1966                 :          0 :                         u64 length, u64 logical, struct page *page,
    1967                 :            :                         int mirror_num)
    1968                 :            : {
    1969                 :            :         struct bio *bio;
    1970                 :            :         struct btrfs_device *dev;
    1971                 :          0 :         u64 map_length = 0;
    1972                 :            :         u64 sector;
    1973                 :          0 :         struct btrfs_bio *bbio = NULL;
    1974                 :          0 :         struct btrfs_mapping_tree *map_tree = &fs_info->mapping_tree;
    1975                 :            :         int ret;
    1976                 :            : 
    1977                 :            :         ASSERT(!(fs_info->sb->s_flags & MS_RDONLY));
    1978         [ #  # ]:          0 :         BUG_ON(!mirror_num);
    1979                 :            : 
    1980                 :            :         /* we can't repair anything in raid56 yet */
    1981         [ #  # ]:          0 :         if (btrfs_is_parity_mirror(map_tree, logical, length, mirror_num))
    1982                 :            :                 return 0;
    1983                 :            : 
    1984                 :          0 :         bio = btrfs_io_bio_alloc(GFP_NOFS, 1);
    1985         [ #  # ]:          0 :         if (!bio)
    1986                 :            :                 return -EIO;
    1987                 :          0 :         bio->bi_size = 0;
    1988                 :          0 :         map_length = length;
    1989                 :            : 
    1990                 :          0 :         ret = btrfs_map_block(fs_info, WRITE, logical,
    1991                 :            :                               &map_length, &bbio, mirror_num);
    1992         [ #  # ]:          0 :         if (ret) {
    1993                 :          0 :                 bio_put(bio);
    1994                 :          0 :                 return -EIO;
    1995                 :            :         }
    1996         [ #  # ]:          0 :         BUG_ON(mirror_num != bbio->mirror_num);
    1997                 :          0 :         sector = bbio->stripes[mirror_num-1].physical >> 9;
    1998                 :          0 :         bio->bi_sector = sector;
    1999                 :          0 :         dev = bbio->stripes[mirror_num-1].dev;
    2000                 :          0 :         kfree(bbio);
    2001 [ #  # ][ #  # ]:          0 :         if (!dev || !dev->bdev || !dev->writeable) {
                 [ #  # ]
    2002                 :          0 :                 bio_put(bio);
    2003                 :          0 :                 return -EIO;
    2004                 :            :         }
    2005                 :          0 :         bio->bi_bdev = dev->bdev;
    2006                 :          0 :         bio_add_page(bio, page, length, start - page_offset(page));
    2007                 :            : 
    2008         [ #  # ]:          0 :         if (btrfsic_submit_bio_wait(WRITE_SYNC, bio)) {
    2009                 :            :                 /* try to remap that extent elsewhere? */
    2010                 :          0 :                 bio_put(bio);
    2011                 :          0 :                 btrfs_dev_stat_inc_and_print(dev, BTRFS_DEV_STAT_WRITE_ERRS);
    2012                 :          0 :                 return -EIO;
    2013                 :            :         }
    2014                 :            : 
    2015         [ #  # ]:          0 :         printk_ratelimited_in_rcu(KERN_INFO "btrfs read error corrected: ino %lu off %llu "
    2016                 :            :                       "(dev %s sector %llu)\n", page->mapping->host->i_ino,
    2017                 :            :                       start, rcu_str_deref(dev->name), sector);
    2018                 :            : 
    2019                 :          0 :         bio_put(bio);
    2020                 :          0 :         return 0;
    2021                 :            : }
    2022                 :            : 
    2023                 :          0 : int repair_eb_io_failure(struct btrfs_root *root, struct extent_buffer *eb,
    2024                 :            :                          int mirror_num)
    2025                 :            : {
    2026                 :          0 :         u64 start = eb->start;
    2027                 :          0 :         unsigned long i, num_pages = num_extent_pages(eb->start, eb->len);
    2028                 :            :         int ret = 0;
    2029                 :            : 
    2030         [ #  # ]:          0 :         if (root->fs_info->sb->s_flags & MS_RDONLY)
    2031                 :            :                 return -EROFS;
    2032                 :            : 
    2033         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    2034                 :            :                 struct page *p = extent_buffer_page(eb, i);
    2035                 :          0 :                 ret = repair_io_failure(root->fs_info, start, PAGE_CACHE_SIZE,
    2036                 :            :                                         start, p, mirror_num);
    2037         [ #  # ]:          0 :                 if (ret)
    2038                 :            :                         break;
    2039                 :          0 :                 start += PAGE_CACHE_SIZE;
    2040                 :            :         }
    2041                 :            : 
    2042                 :          0 :         return ret;
    2043                 :            : }
    2044                 :            : 
    2045                 :            : /*
    2046                 :            :  * each time an IO finishes, we do a fast check in the IO failure tree
    2047                 :            :  * to see if we need to process or clean up an io_failure_record
    2048                 :            :  */
    2049                 :          0 : static int clean_io_failure(u64 start, struct page *page)
    2050                 :            : {
    2051                 :            :         u64 private;
    2052                 :            :         u64 private_failure;
    2053                 :            :         struct io_failure_record *failrec;
    2054                 :          0 :         struct inode *inode = page->mapping->host;
    2055                 :          0 :         struct btrfs_fs_info *fs_info = BTRFS_I(inode)->root->fs_info;
    2056                 :            :         struct extent_state *state;
    2057                 :            :         int num_copies;
    2058                 :            :         int did_repair = 0;
    2059                 :            :         int ret;
    2060                 :            : 
    2061                 :          0 :         private = 0;
    2062                 :          0 :         ret = count_range_bits(&BTRFS_I(inode)->io_failure_tree, &private,
    2063                 :            :                                 (u64)-1, 1, EXTENT_DIRTY, 0);
    2064         [ #  # ]:          0 :         if (!ret)
    2065                 :            :                 return 0;
    2066                 :            : 
    2067                 :          0 :         ret = get_state_private(&BTRFS_I(inode)->io_failure_tree, start,
    2068                 :            :                                 &private_failure);
    2069         [ #  # ]:          0 :         if (ret)
    2070                 :            :                 return 0;
    2071                 :            : 
    2072                 :          0 :         failrec = (struct io_failure_record *)(unsigned long) private_failure;
    2073         [ #  # ]:          0 :         BUG_ON(!failrec->this_mirror);
    2074                 :            : 
    2075         [ #  # ]:          0 :         if (failrec->in_validation) {
    2076                 :            :                 /* there was no real error, just free the record */
    2077                 :            :                 pr_debug("clean_io_failure: freeing dummy error at %llu\n",
    2078                 :            :                          failrec->start);
    2079                 :            :                 did_repair = 1;
    2080                 :            :                 goto out;
    2081                 :            :         }
    2082         [ #  # ]:          0 :         if (fs_info->sb->s_flags & MS_RDONLY)
    2083                 :            :                 goto out;
    2084                 :            : 
    2085                 :            :         spin_lock(&BTRFS_I(inode)->io_tree.lock);
    2086                 :          0 :         state = find_first_extent_bit_state(&BTRFS_I(inode)->io_tree,
    2087                 :            :                                             failrec->start,
    2088                 :            :                                             EXTENT_LOCKED);
    2089                 :            :         spin_unlock(&BTRFS_I(inode)->io_tree.lock);
    2090                 :            : 
    2091 [ #  # ][ #  # ]:          0 :         if (state && state->start <= failrec->start &&
                 [ #  # ]
    2092                 :          0 :             state->end >= failrec->start + failrec->len - 1) {
    2093                 :          0 :                 num_copies = btrfs_num_copies(fs_info, failrec->logical,
    2094                 :            :                                               failrec->len);
    2095         [ #  # ]:          0 :                 if (num_copies > 1)  {
    2096                 :          0 :                         ret = repair_io_failure(fs_info, start, failrec->len,
    2097                 :            :                                                 failrec->logical, page,
    2098                 :            :                                                 failrec->failed_mirror);
    2099                 :            :                         did_repair = !ret;
    2100                 :            :                 }
    2101                 :            :                 ret = 0;
    2102                 :            :         }
    2103                 :            : 
    2104                 :            : out:
    2105         [ #  # ]:          0 :         if (!ret)
    2106                 :          0 :                 ret = free_io_failure(inode, failrec, did_repair);
    2107                 :            : 
    2108                 :          0 :         return ret;
    2109                 :            : }
    2110                 :            : 
    2111                 :            : /*
    2112                 :            :  * this is a generic handler for readpage errors (default
    2113                 :            :  * readpage_io_failed_hook). if other copies exist, read those and write back
    2114                 :            :  * good data to the failed position. does not investigate in remapping the
    2115                 :            :  * failed extent elsewhere, hoping the device will be smart enough to do this as
    2116                 :            :  * needed
    2117                 :            :  */
    2118                 :            : 
    2119                 :          0 : static int bio_readpage_error(struct bio *failed_bio, u64 phy_offset,
    2120                 :          0 :                               struct page *page, u64 start, u64 end,
    2121                 :            :                               int failed_mirror)
    2122                 :            : {
    2123                 :            :         struct io_failure_record *failrec = NULL;
    2124                 :            :         u64 private;
    2125                 :            :         struct extent_map *em;
    2126                 :          0 :         struct inode *inode = page->mapping->host;
    2127                 :          0 :         struct extent_io_tree *failure_tree = &BTRFS_I(inode)->io_failure_tree;
    2128                 :          0 :         struct extent_io_tree *tree = &BTRFS_I(inode)->io_tree;
    2129                 :          0 :         struct extent_map_tree *em_tree = &BTRFS_I(inode)->extent_tree;
    2130                 :            :         struct bio *bio;
    2131                 :            :         struct btrfs_io_bio *btrfs_failed_bio;
    2132                 :            :         struct btrfs_io_bio *btrfs_bio;
    2133                 :            :         int num_copies;
    2134                 :            :         int ret;
    2135                 :            :         int read_mode;
    2136                 :            :         u64 logical;
    2137                 :            : 
    2138         [ #  # ]:          0 :         BUG_ON(failed_bio->bi_rw & REQ_WRITE);
    2139                 :            : 
    2140                 :          0 :         ret = get_state_private(failure_tree, start, &private);
    2141         [ #  # ]:          0 :         if (ret) {
    2142                 :            :                 failrec = kzalloc(sizeof(*failrec), GFP_NOFS);
    2143         [ #  # ]:          0 :                 if (!failrec)
    2144                 :            :                         return -ENOMEM;
    2145                 :          0 :                 failrec->start = start;
    2146                 :          0 :                 failrec->len = end - start + 1;
    2147                 :          0 :                 failrec->this_mirror = 0;
    2148                 :          0 :                 failrec->bio_flags = 0;
    2149                 :          0 :                 failrec->in_validation = 0;
    2150                 :            : 
    2151                 :          0 :                 read_lock(&em_tree->lock);
    2152                 :          0 :                 em = lookup_extent_mapping(em_tree, start, failrec->len);
    2153         [ #  # ]:          0 :                 if (!em) {
    2154                 :            :                         read_unlock(&em_tree->lock);
    2155                 :          0 :                         kfree(failrec);
    2156                 :          0 :                         return -EIO;
    2157                 :            :                 }
    2158                 :            : 
    2159 [ #  # ][ #  # ]:          0 :                 if (em->start > start || em->start + em->len < start) {
    2160                 :          0 :                         free_extent_map(em);
    2161                 :            :                         em = NULL;
    2162                 :            :                 }
    2163                 :            :                 read_unlock(&em_tree->lock);
    2164                 :            : 
    2165         [ #  # ]:          0 :                 if (!em) {
    2166                 :          0 :                         kfree(failrec);
    2167                 :          0 :                         return -EIO;
    2168                 :            :                 }
    2169                 :          0 :                 logical = start - em->start;
    2170                 :          0 :                 logical = em->block_start + logical;
    2171         [ #  # ]:          0 :                 if (test_bit(EXTENT_FLAG_COMPRESSED, &em->flags)) {
    2172                 :            :                         logical = em->block_start;
    2173                 :          0 :                         failrec->bio_flags = EXTENT_BIO_COMPRESSED;
    2174                 :          0 :                         extent_set_compress_type(&failrec->bio_flags,
    2175                 :          0 :                                                  em->compress_type);
    2176                 :            :                 }
    2177                 :            :                 pr_debug("bio_readpage_error: (new) logical=%llu, start=%llu, "
    2178                 :            :                          "len=%llu\n", logical, start, failrec->len);
    2179                 :          0 :                 failrec->logical = logical;
    2180                 :          0 :                 free_extent_map(em);
    2181                 :            : 
    2182                 :            :                 /* set the bits in the private failure tree */
    2183                 :            :                 ret = set_extent_bits(failure_tree, start, end,
    2184                 :            :                                         EXTENT_LOCKED | EXTENT_DIRTY, GFP_NOFS);
    2185         [ #  # ]:          0 :                 if (ret >= 0)
    2186                 :          0 :                         ret = set_state_private(failure_tree, start,
    2187                 :          0 :                                                 (u64)(unsigned long)failrec);
    2188                 :            :                 /* set the bits in the inode's tree */
    2189         [ #  # ]:          0 :                 if (ret >= 0)
    2190                 :            :                         ret = set_extent_bits(tree, start, end, EXTENT_DAMAGED,
    2191                 :            :                                                 GFP_NOFS);
    2192         [ #  # ]:          0 :                 if (ret < 0) {
    2193                 :          0 :                         kfree(failrec);
    2194                 :          0 :                         return ret;
    2195                 :            :                 }
    2196                 :            :         } else {
    2197                 :          0 :                 failrec = (struct io_failure_record *)(unsigned long)private;
    2198                 :            :                 pr_debug("bio_readpage_error: (found) logical=%llu, "
    2199                 :            :                          "start=%llu, len=%llu, validation=%d\n",
    2200                 :            :                          failrec->logical, failrec->start, failrec->len,
    2201                 :            :                          failrec->in_validation);
    2202                 :            :                 /*
    2203                 :            :                  * when data can be on disk more than twice, add to failrec here
    2204                 :            :                  * (e.g. with a list for failed_mirror) to make
    2205                 :            :                  * clean_io_failure() clean all those errors at once.
    2206                 :            :                  */
    2207                 :            :         }
    2208                 :          0 :         num_copies = btrfs_num_copies(BTRFS_I(inode)->root->fs_info,
    2209                 :            :                                       failrec->logical, failrec->len);
    2210         [ #  # ]:          0 :         if (num_copies == 1) {
    2211                 :            :                 /*
    2212                 :            :                  * we only have a single copy of the data, so don't bother with
    2213                 :            :                  * all the retry and error correction code that follows. no
    2214                 :            :                  * matter what the error is, it is very likely to persist.
    2215                 :            :                  */
    2216                 :            :                 pr_debug("bio_readpage_error: cannot repair, num_copies=%d, next_mirror %d, failed_mirror %d\n",
    2217                 :            :                          num_copies, failrec->this_mirror, failed_mirror);
    2218                 :          0 :                 free_io_failure(inode, failrec, 0);
    2219                 :          0 :                 return -EIO;
    2220                 :            :         }
    2221                 :            : 
    2222                 :            :         /*
    2223                 :            :          * there are two premises:
    2224                 :            :          *      a) deliver good data to the caller
    2225                 :            :          *      b) correct the bad sectors on disk
    2226                 :            :          */
    2227         [ #  # ]:          0 :         if (failed_bio->bi_vcnt > 1) {
    2228                 :            :                 /*
    2229                 :            :                  * to fulfill b), we need to know the exact failing sectors, as
    2230                 :            :                  * we don't want to rewrite any more than the failed ones. thus,
    2231                 :            :                  * we need separate read requests for the failed bio
    2232                 :            :                  *
    2233                 :            :                  * if the following BUG_ON triggers, our validation request got
    2234                 :            :                  * merged. we need separate requests for our algorithm to work.
    2235                 :            :                  */
    2236         [ #  # ]:          0 :                 BUG_ON(failrec->in_validation);
    2237                 :          0 :                 failrec->in_validation = 1;
    2238                 :          0 :                 failrec->this_mirror = failed_mirror;
    2239                 :            :                 read_mode = READ_SYNC | REQ_FAILFAST_DEV;
    2240                 :            :         } else {
    2241                 :            :                 /*
    2242                 :            :                  * we're ready to fulfill a) and b) alongside. get a good copy
    2243                 :            :                  * of the failed sector and if we succeed, we have setup
    2244                 :            :                  * everything for repair_io_failure to do the rest for us.
    2245                 :            :                  */
    2246         [ #  # ]:          0 :                 if (failrec->in_validation) {
    2247         [ #  # ]:          0 :                         BUG_ON(failrec->this_mirror != failed_mirror);
    2248                 :          0 :                         failrec->in_validation = 0;
    2249                 :          0 :                         failrec->this_mirror = 0;
    2250                 :            :                 }
    2251                 :          0 :                 failrec->failed_mirror = failed_mirror;
    2252                 :          0 :                 failrec->this_mirror++;
    2253         [ #  # ]:          0 :                 if (failrec->this_mirror == failed_mirror)
    2254                 :          0 :                         failrec->this_mirror++;
    2255                 :            :                 read_mode = READ_SYNC;
    2256                 :            :         }
    2257                 :            : 
    2258         [ #  # ]:          0 :         if (failrec->this_mirror > num_copies) {
    2259                 :            :                 pr_debug("bio_readpage_error: (fail) num_copies=%d, next_mirror %d, failed_mirror %d\n",
    2260                 :            :                          num_copies, failrec->this_mirror, failed_mirror);
    2261                 :          0 :                 free_io_failure(inode, failrec, 0);
    2262                 :          0 :                 return -EIO;
    2263                 :            :         }
    2264                 :            : 
    2265                 :          0 :         bio = btrfs_io_bio_alloc(GFP_NOFS, 1);
    2266         [ #  # ]:          0 :         if (!bio) {
    2267                 :          0 :                 free_io_failure(inode, failrec, 0);
    2268                 :          0 :                 return -EIO;
    2269                 :            :         }
    2270                 :          0 :         bio->bi_end_io = failed_bio->bi_end_io;
    2271                 :          0 :         bio->bi_sector = failrec->logical >> 9;
    2272                 :          0 :         bio->bi_bdev = BTRFS_I(inode)->root->fs_info->fs_devices->latest_bdev;
    2273                 :          0 :         bio->bi_size = 0;
    2274                 :            : 
    2275                 :            :         btrfs_failed_bio = btrfs_io_bio(failed_bio);
    2276         [ #  # ]:          0 :         if (btrfs_failed_bio->csum) {
    2277                 :          0 :                 struct btrfs_fs_info *fs_info = BTRFS_I(inode)->root->fs_info;
    2278                 :          0 :                 u16 csum_size = btrfs_super_csum_size(fs_info->super_copy);
    2279                 :            : 
    2280                 :            :                 btrfs_bio = btrfs_io_bio(bio);
    2281                 :          0 :                 btrfs_bio->csum = btrfs_bio->csum_inline;
    2282                 :          0 :                 phy_offset >>= inode->i_sb->s_blocksize_bits;
    2283                 :          0 :                 phy_offset *= csum_size;
    2284                 :          0 :                 memcpy(btrfs_bio->csum, btrfs_failed_bio->csum + phy_offset,
    2285                 :            :                        csum_size);
    2286                 :            :         }
    2287                 :            : 
    2288                 :          0 :         bio_add_page(bio, page, failrec->len, start - page_offset(page));
    2289                 :            : 
    2290                 :            :         pr_debug("bio_readpage_error: submitting new read[%#x] to "
    2291                 :            :                  "this_mirror=%d, num_copies=%d, in_validation=%d\n", read_mode,
    2292                 :            :                  failrec->this_mirror, num_copies, failrec->in_validation);
    2293                 :            : 
    2294                 :          0 :         ret = tree->ops->submit_bio_hook(inode, read_mode, bio,
    2295                 :            :                                          failrec->this_mirror,
    2296                 :            :                                          failrec->bio_flags, 0);
    2297                 :          0 :         return ret;
    2298                 :            : }
    2299                 :            : 
    2300                 :            : /* lots and lots of room for performance fixes in the end_bio funcs */
    2301                 :            : 
    2302                 :          0 : int end_extent_writepage(struct page *page, int err, u64 start, u64 end)
    2303                 :            : {
    2304                 :          0 :         int uptodate = (err == 0);
    2305                 :            :         struct extent_io_tree *tree;
    2306                 :            :         int ret;
    2307                 :            : 
    2308                 :          0 :         tree = &BTRFS_I(page->mapping->host)->io_tree;
    2309                 :            : 
    2310 [ #  # ][ #  # ]:          0 :         if (tree->ops && tree->ops->writepage_end_io_hook) {
    2311                 :          0 :                 ret = tree->ops->writepage_end_io_hook(page, start,
    2312                 :            :                                                end, NULL, uptodate);
    2313         [ #  # ]:          0 :                 if (ret)
    2314                 :            :                         uptodate = 0;
    2315                 :            :         }
    2316                 :            : 
    2317         [ #  # ]:          0 :         if (!uptodate) {
    2318                 :            :                 ClearPageUptodate(page);
    2319                 :            :                 SetPageError(page);
    2320                 :            :         }
    2321                 :          0 :         return 0;
    2322                 :            : }
    2323                 :            : 
    2324                 :            : /*
    2325                 :            :  * after a writepage IO is done, we need to:
    2326                 :            :  * clear the uptodate bits on error
    2327                 :            :  * clear the writeback bits in the extent tree for this IO
    2328                 :            :  * end_page_writeback if the page has no more pending IO
    2329                 :            :  *
    2330                 :            :  * Scheduling is not allowed, so the extent state tree is expected
    2331                 :            :  * to have one and only one object corresponding to this IO.
    2332                 :            :  */
    2333                 :          0 : static void end_bio_extent_writepage(struct bio *bio, int err)
    2334                 :            : {
    2335                 :          0 :         struct bio_vec *bvec = bio->bi_io_vec + bio->bi_vcnt - 1;
    2336                 :            :         struct extent_io_tree *tree;
    2337                 :            :         u64 start;
    2338                 :            :         u64 end;
    2339                 :            : 
    2340                 :            :         do {
    2341                 :          0 :                 struct page *page = bvec->bv_page;
    2342                 :            :                 tree = &BTRFS_I(page->mapping->host)->io_tree;
    2343                 :            : 
    2344                 :            :                 /* We always issue full-page reads, but if some block
    2345                 :            :                  * in a page fails to read, blk_update_request() will
    2346                 :            :                  * advance bv_offset and adjust bv_len to compensate.
    2347                 :            :                  * Print a warning for nonzero offsets, and an error
    2348                 :            :                  * if they don't add up to a full page.  */
    2349 [ #  # ][ #  # ]:          0 :                 if (bvec->bv_offset || bvec->bv_len != PAGE_CACHE_SIZE)
    2350         [ #  # ]:          0 :                         printk("%s page write in btrfs with offset %u and length %u\n",
    2351                 :          0 :                                bvec->bv_offset + bvec->bv_len != PAGE_CACHE_SIZE
    2352                 :            :                                ? KERN_ERR "partial" : KERN_INFO "incomplete",
    2353                 :            :                                bvec->bv_offset, bvec->bv_len);
    2354                 :            : 
    2355                 :          0 :                 start = page_offset(page);
    2356                 :          0 :                 end = start + bvec->bv_offset + bvec->bv_len - 1;
    2357                 :            : 
    2358         [ #  # ]:          0 :                 if (--bvec >= bio->bi_io_vec)
    2359                 :          0 :                         prefetchw(&bvec->bv_page->flags);
    2360                 :            : 
    2361         [ #  # ]:          0 :                 if (end_extent_writepage(page, err, start, end))
    2362                 :          0 :                         continue;
    2363                 :            : 
    2364                 :          0 :                 end_page_writeback(page);
    2365         [ #  # ]:          0 :         } while (bvec >= bio->bi_io_vec);
    2366                 :            : 
    2367                 :          0 :         bio_put(bio);
    2368                 :          0 : }
    2369                 :            : 
    2370                 :            : static void
    2371                 :          0 : endio_readpage_release_extent(struct extent_io_tree *tree, u64 start, u64 len,
    2372                 :            :                               int uptodate)
    2373                 :            : {
    2374                 :          0 :         struct extent_state *cached = NULL;
    2375                 :          0 :         u64 end = start + len - 1;
    2376                 :            : 
    2377 [ #  # ][ #  # ]:          0 :         if (uptodate && tree->track_uptodate)
    2378                 :            :                 set_extent_uptodate(tree, start, end, &cached, GFP_ATOMIC);
    2379                 :            :         unlock_extent_cached(tree, start, end, &cached, GFP_ATOMIC);
    2380                 :          0 : }
    2381                 :            : 
    2382                 :            : /*
    2383                 :            :  * after a readpage IO is done, we need to:
    2384                 :            :  * clear the uptodate bits on error
    2385                 :            :  * set the uptodate bits if things worked
    2386                 :            :  * set the page up to date if all extents in the tree are uptodate
    2387                 :            :  * clear the lock bit in the extent tree
    2388                 :            :  * unlock the page if there are no other extents locked for it
    2389                 :            :  *
    2390                 :            :  * Scheduling is not allowed, so the extent state tree is expected
    2391                 :            :  * to have one and only one object corresponding to this IO.
    2392                 :            :  */
    2393                 :          0 : static void end_bio_extent_readpage(struct bio *bio, int err)
    2394                 :            : {
    2395                 :            :         int uptodate = test_bit(BIO_UPTODATE, &bio->bi_flags);
    2396                 :          0 :         struct bio_vec *bvec_end = bio->bi_io_vec + bio->bi_vcnt - 1;
    2397                 :            :         struct bio_vec *bvec = bio->bi_io_vec;
    2398                 :          0 :         struct btrfs_io_bio *io_bio = btrfs_io_bio(bio);
    2399                 :            :         struct extent_io_tree *tree;
    2400                 :            :         u64 offset = 0;
    2401                 :            :         u64 start;
    2402                 :            :         u64 end;
    2403                 :            :         u64 len;
    2404                 :            :         u64 extent_start = 0;
    2405                 :            :         u64 extent_len = 0;
    2406                 :            :         int mirror;
    2407                 :            :         int ret;
    2408                 :            : 
    2409         [ #  # ]:          0 :         if (err)
    2410                 :            :                 uptodate = 0;
    2411                 :            : 
    2412                 :            :         do {
    2413                 :          0 :                 struct page *page = bvec->bv_page;
    2414                 :          0 :                 struct inode *inode = page->mapping->host;
    2415                 :            : 
    2416                 :            :                 pr_debug("end_bio_extent_readpage: bi_sector=%llu, err=%d, "
    2417                 :            :                          "mirror=%lu\n", (u64)bio->bi_sector, err,
    2418                 :            :                          io_bio->mirror_num);
    2419                 :          0 :                 tree = &BTRFS_I(inode)->io_tree;
    2420                 :            : 
    2421                 :            :                 /* We always issue full-page reads, but if some block
    2422                 :            :                  * in a page fails to read, blk_update_request() will
    2423                 :            :                  * advance bv_offset and adjust bv_len to compensate.
    2424                 :            :                  * Print a warning for nonzero offsets, and an error
    2425                 :            :                  * if they don't add up to a full page.  */
    2426 [ #  # ][ #  # ]:          0 :                 if (bvec->bv_offset || bvec->bv_len != PAGE_CACHE_SIZE)
    2427         [ #  # ]:          0 :                         printk("%s page read in btrfs with offset %u and length %u\n",
    2428                 :          0 :                                bvec->bv_offset + bvec->bv_len != PAGE_CACHE_SIZE
    2429                 :            :                                ? KERN_ERR "partial" : KERN_INFO "incomplete",
    2430                 :            :                                bvec->bv_offset, bvec->bv_len);
    2431                 :            : 
    2432                 :          0 :                 start = page_offset(page);
    2433                 :          0 :                 end = start + bvec->bv_offset + bvec->bv_len - 1;
    2434                 :            :                 len = bvec->bv_len;
    2435                 :            : 
    2436         [ #  # ]:          0 :                 if (++bvec <= bvec_end)
    2437                 :          0 :                         prefetchw(&bvec->bv_page->flags);
    2438                 :            : 
    2439                 :          0 :                 mirror = io_bio->mirror_num;
    2440 [ #  # ][ #  # ]:          0 :                 if (likely(uptodate && tree->ops &&
         [ #  # ][ #  # ]
    2441                 :            :                            tree->ops->readpage_end_io_hook)) {
    2442                 :          0 :                         ret = tree->ops->readpage_end_io_hook(io_bio, offset,
    2443                 :            :                                                               page, start, end,
    2444                 :            :                                                               mirror);
    2445         [ #  # ]:          0 :                         if (ret)
    2446                 :            :                                 uptodate = 0;
    2447                 :            :                         else
    2448                 :          0 :                                 clean_io_failure(start, page);
    2449                 :            :                 }
    2450                 :            : 
    2451         [ #  # ]:          0 :                 if (likely(uptodate))
    2452                 :            :                         goto readpage_ok;
    2453                 :            : 
    2454 [ #  # ][ #  # ]:          0 :                 if (tree->ops && tree->ops->readpage_io_failed_hook) {
    2455                 :          0 :                         ret = tree->ops->readpage_io_failed_hook(page, mirror);
    2456 [ #  # ][ #  # ]:          0 :                         if (!ret && !err &&
    2457                 :            :                             test_bit(BIO_UPTODATE, &bio->bi_flags))
    2458                 :            :                                 uptodate = 1;
    2459                 :            :                 } else {
    2460                 :            :                         /*
    2461                 :            :                          * The generic bio_readpage_error handles errors the
    2462                 :            :                          * following way: If possible, new read requests are
    2463                 :            :                          * created and submitted and will end up in
    2464                 :            :                          * end_bio_extent_readpage as well (if we're lucky, not
    2465                 :            :                          * in the !uptodate case). In that case it returns 0 and
    2466                 :            :                          * we just go on with the next page in our bio. If it
    2467                 :            :                          * can't handle the error it will return -EIO and we
    2468                 :            :                          * remain responsible for that page.
    2469                 :            :                          */
    2470                 :          0 :                         ret = bio_readpage_error(bio, offset, page, start, end,
    2471                 :            :                                                  mirror);
    2472         [ #  # ]:          0 :                         if (ret == 0) {
    2473                 :            :                                 uptodate =
    2474                 :            :                                         test_bit(BIO_UPTODATE, &bio->bi_flags);
    2475         [ #  # ]:          0 :                                 if (err)
    2476                 :            :                                         uptodate = 0;
    2477                 :          0 :                                 continue;
    2478                 :            :                         }
    2479                 :            :                 }
    2480                 :            : readpage_ok:
    2481         [ #  # ]:          0 :                 if (likely(uptodate)) {
    2482                 :            :                         loff_t i_size = i_size_read(inode);
    2483                 :          0 :                         pgoff_t end_index = i_size >> PAGE_CACHE_SHIFT;
    2484                 :            :                         unsigned offset;
    2485                 :            : 
    2486                 :            :                         /* Zero out the end if this page straddles i_size */
    2487                 :          0 :                         offset = i_size & (PAGE_CACHE_SIZE-1);
    2488 [ #  # ][ #  # ]:          0 :                         if (page->index == end_index && offset)
    2489                 :            :                                 zero_user_segment(page, offset, PAGE_CACHE_SIZE);
    2490                 :            :                         SetPageUptodate(page);
    2491                 :            :                 } else {
    2492                 :            :                         ClearPageUptodate(page);
    2493                 :            :                         SetPageError(page);
    2494                 :            :                 }
    2495                 :          0 :                 unlock_page(page);
    2496                 :          0 :                 offset += len;
    2497                 :            : 
    2498         [ #  # ]:          0 :                 if (unlikely(!uptodate)) {
    2499         [ #  # ]:          0 :                         if (extent_len) {
    2500                 :          0 :                                 endio_readpage_release_extent(tree,
    2501                 :            :                                                               extent_start,
    2502                 :            :                                                               extent_len, 1);
    2503                 :            :                                 extent_start = 0;
    2504                 :            :                                 extent_len = 0;
    2505                 :            :                         }
    2506                 :          0 :                         endio_readpage_release_extent(tree, start,
    2507                 :          0 :                                                       end - start + 1, 0);
    2508         [ #  # ]:          0 :                 } else if (!extent_len) {
    2509                 :            :                         extent_start = start;
    2510                 :          0 :                         extent_len = end + 1 - start;
    2511         [ #  # ]:          0 :                 } else if (extent_start + extent_len == start) {
    2512                 :          0 :                         extent_len += end + 1 - start;
    2513                 :            :                 } else {
    2514                 :          0 :                         endio_readpage_release_extent(tree, extent_start,
    2515                 :            :                                                       extent_len, uptodate);
    2516                 :            :                         extent_start = start;
    2517                 :          0 :                         extent_len = end + 1 - start;
    2518                 :            :                 }
    2519         [ #  # ]:          0 :         } while (bvec <= bvec_end);
    2520                 :            : 
    2521         [ #  # ]:          0 :         if (extent_len)
    2522                 :          0 :                 endio_readpage_release_extent(tree, extent_start, extent_len,
    2523                 :            :                                               uptodate);
    2524         [ #  # ]:          0 :         if (io_bio->end_io)
    2525                 :          0 :                 io_bio->end_io(io_bio, err);
    2526                 :          0 :         bio_put(bio);
    2527                 :          0 : }
    2528                 :            : 
    2529                 :            : /*
    2530                 :            :  * this allocates from the btrfs_bioset.  We're returning a bio right now
    2531                 :            :  * but you can call btrfs_io_bio for the appropriate container_of magic
    2532                 :            :  */
    2533                 :            : struct bio *
    2534                 :          0 : btrfs_bio_alloc(struct block_device *bdev, u64 first_sector, int nr_vecs,
    2535                 :            :                 gfp_t gfp_flags)
    2536                 :            : {
    2537                 :            :         struct btrfs_io_bio *btrfs_bio;
    2538                 :            :         struct bio *bio;
    2539                 :            : 
    2540                 :          0 :         bio = bio_alloc_bioset(gfp_flags, nr_vecs, btrfs_bioset);
    2541                 :            : 
    2542 [ #  # ][ #  # ]:          0 :         if (bio == NULL && (current->flags & PF_MEMALLOC)) {
    2543 [ #  # ][ #  # ]:          0 :                 while (!bio && (nr_vecs /= 2)) {
    2544                 :          0 :                         bio = bio_alloc_bioset(gfp_flags,
    2545                 :            :                                                nr_vecs, btrfs_bioset);
    2546                 :            :                 }
    2547                 :            :         }
    2548                 :            : 
    2549         [ #  # ]:          0 :         if (bio) {
    2550                 :          0 :                 bio->bi_size = 0;
    2551                 :          0 :                 bio->bi_bdev = bdev;
    2552                 :          0 :                 bio->bi_sector = first_sector;
    2553                 :            :                 btrfs_bio = btrfs_io_bio(bio);
    2554                 :          0 :                 btrfs_bio->csum = NULL;
    2555                 :          0 :                 btrfs_bio->csum_allocated = NULL;
    2556                 :          0 :                 btrfs_bio->end_io = NULL;
    2557                 :            :         }
    2558                 :          0 :         return bio;
    2559                 :            : }
    2560                 :            : 
    2561                 :          0 : struct bio *btrfs_bio_clone(struct bio *bio, gfp_t gfp_mask)
    2562                 :            : {
    2563                 :          0 :         return bio_clone_bioset(bio, gfp_mask, btrfs_bioset);
    2564                 :            : }
    2565                 :            : 
    2566                 :            : 
    2567                 :            : /* this also allocates from the btrfs_bioset */
    2568                 :          0 : struct bio *btrfs_io_bio_alloc(gfp_t gfp_mask, unsigned int nr_iovecs)
    2569                 :            : {
    2570                 :            :         struct btrfs_io_bio *btrfs_bio;
    2571                 :            :         struct bio *bio;
    2572                 :            : 
    2573                 :          0 :         bio = bio_alloc_bioset(gfp_mask, nr_iovecs, btrfs_bioset);
    2574         [ #  # ]:          0 :         if (bio) {
    2575                 :            :                 btrfs_bio = btrfs_io_bio(bio);
    2576                 :          0 :                 btrfs_bio->csum = NULL;
    2577                 :          0 :                 btrfs_bio->csum_allocated = NULL;
    2578                 :          0 :                 btrfs_bio->end_io = NULL;
    2579                 :            :         }
    2580                 :          0 :         return bio;
    2581                 :            : }
    2582                 :            : 
    2583                 :            : 
    2584                 :          0 : static int __must_check submit_one_bio(int rw, struct bio *bio,
    2585                 :            :                                        int mirror_num, unsigned long bio_flags)
    2586                 :            : {
    2587                 :            :         int ret = 0;
    2588                 :          0 :         struct bio_vec *bvec = bio->bi_io_vec + bio->bi_vcnt - 1;
    2589                 :          0 :         struct page *page = bvec->bv_page;
    2590                 :          0 :         struct extent_io_tree *tree = bio->bi_private;
    2591                 :            :         u64 start;
    2592                 :            : 
    2593                 :          0 :         start = page_offset(page) + bvec->bv_offset;
    2594                 :            : 
    2595                 :          0 :         bio->bi_private = NULL;
    2596                 :            : 
    2597                 :          0 :         bio_get(bio);
    2598                 :            : 
    2599 [ #  # ][ #  # ]:          0 :         if (tree->ops && tree->ops->submit_bio_hook)
    2600                 :          0 :                 ret = tree->ops->submit_bio_hook(page->mapping->host, rw, bio,
    2601                 :            :                                            mirror_num, bio_flags, start);
    2602                 :            :         else
    2603                 :          0 :                 btrfsic_submit_bio(rw, bio);
    2604                 :            : 
    2605         [ #  # ]:          0 :         if (bio_flagged(bio, BIO_EOPNOTSUPP))
    2606                 :            :                 ret = -EOPNOTSUPP;
    2607                 :          0 :         bio_put(bio);
    2608                 :          0 :         return ret;
    2609                 :            : }
    2610                 :            : 
    2611                 :          0 : static int merge_bio(int rw, struct extent_io_tree *tree, struct page *page,
    2612                 :            :                      unsigned long offset, size_t size, struct bio *bio,
    2613                 :            :                      unsigned long bio_flags)
    2614                 :            : {
    2615                 :            :         int ret = 0;
    2616 [ #  # ][ #  # ]:          0 :         if (tree->ops && tree->ops->merge_bio_hook)
    2617                 :          0 :                 ret = tree->ops->merge_bio_hook(rw, page, offset, size, bio,
    2618                 :            :                                                 bio_flags);
    2619         [ #  # ]:          0 :         BUG_ON(ret < 0);
    2620                 :          0 :         return ret;
    2621                 :            : 
    2622                 :            : }
    2623                 :            : 
    2624                 :          0 : static int submit_extent_page(int rw, struct extent_io_tree *tree,
    2625                 :            :                               struct page *page, sector_t sector,
    2626                 :            :                               size_t size, unsigned long offset,
    2627                 :            :                               struct block_device *bdev,
    2628                 :            :                               struct bio **bio_ret,
    2629                 :            :                               unsigned long max_pages,
    2630                 :            :                               bio_end_io_t end_io_func,
    2631                 :            :                               int mirror_num,
    2632                 :            :                               unsigned long prev_bio_flags,
    2633                 :            :                               unsigned long bio_flags)
    2634                 :            : {
    2635                 :            :         int ret = 0;
    2636                 :            :         struct bio *bio;
    2637                 :            :         int nr;
    2638                 :            :         int contig = 0;
    2639                 :          0 :         int this_compressed = bio_flags & EXTENT_BIO_COMPRESSED;
    2640                 :          0 :         int old_compressed = prev_bio_flags & EXTENT_BIO_COMPRESSED;
    2641                 :          0 :         size_t page_size = min_t(size_t, size, PAGE_CACHE_SIZE);
    2642                 :            : 
    2643 [ #  # ][ #  # ]:          0 :         if (bio_ret && *bio_ret) {
    2644                 :            :                 bio = *bio_ret;
    2645         [ #  # ]:          0 :                 if (old_compressed)
    2646                 :          0 :                         contig = bio->bi_sector == sector;
    2647                 :            :                 else
    2648                 :          0 :                         contig = bio_end_sector(bio) == sector;
    2649                 :            : 
    2650   [ #  #  #  # ]:          0 :                 if (prev_bio_flags != bio_flags || !contig ||
    2651         [ #  # ]:          0 :                     merge_bio(rw, tree, page, offset, page_size, bio, bio_flags) ||
    2652                 :          0 :                     bio_add_page(bio, page, page_size, offset) < page_size) {
    2653                 :          0 :                         ret = submit_one_bio(rw, bio, mirror_num,
    2654                 :            :                                              prev_bio_flags);
    2655         [ #  # ]:          0 :                         if (ret < 0)
    2656                 :            :                                 return ret;
    2657                 :            :                         bio = NULL;
    2658                 :            :                 } else {
    2659                 :            :                         return 0;
    2660                 :            :                 }
    2661                 :            :         }
    2662         [ #  # ]:          0 :         if (this_compressed)
    2663                 :            :                 nr = BIO_MAX_PAGES;
    2664                 :            :         else
    2665                 :          0 :                 nr = bio_get_nr_vecs(bdev);
    2666                 :            : 
    2667                 :          0 :         bio = btrfs_bio_alloc(bdev, sector, nr, GFP_NOFS | __GFP_HIGH);
    2668         [ #  # ]:          0 :         if (!bio)
    2669                 :            :                 return -ENOMEM;
    2670                 :            : 
    2671                 :          0 :         bio_add_page(bio, page, page_size, offset);
    2672                 :          0 :         bio->bi_end_io = end_io_func;
    2673                 :          0 :         bio->bi_private = tree;
    2674                 :            : 
    2675         [ #  # ]:          0 :         if (bio_ret)
    2676                 :          0 :                 *bio_ret = bio;
    2677                 :            :         else
    2678                 :          0 :                 ret = submit_one_bio(rw, bio, mirror_num, bio_flags);
    2679                 :            : 
    2680                 :            :         return ret;
    2681                 :            : }
    2682                 :            : 
    2683                 :          0 : static void attach_extent_buffer_page(struct extent_buffer *eb,
    2684                 :            :                                       struct page *page)
    2685                 :            : {
    2686         [ #  # ]:          0 :         if (!PagePrivate(page)) {
    2687                 :            :                 SetPagePrivate(page);
    2688                 :            :                 page_cache_get(page);
    2689                 :          0 :                 set_page_private(page, (unsigned long)eb);
    2690                 :            :         } else {
    2691         [ #  # ]:          0 :                 WARN_ON(page->private != (unsigned long)eb);
    2692                 :            :         }
    2693                 :          0 : }
    2694                 :            : 
    2695                 :          0 : void set_page_extent_mapped(struct page *page)
    2696                 :            : {
    2697         [ #  # ]:          0 :         if (!PagePrivate(page)) {
    2698                 :            :                 SetPagePrivate(page);
    2699                 :            :                 page_cache_get(page);
    2700                 :          0 :                 set_page_private(page, EXTENT_PAGE_PRIVATE);
    2701                 :            :         }
    2702                 :          0 : }
    2703                 :            : 
    2704                 :            : static struct extent_map *
    2705                 :          0 : __get_extent_map(struct inode *inode, struct page *page, size_t pg_offset,
    2706                 :            :                  u64 start, u64 len, get_extent_t *get_extent,
    2707                 :            :                  struct extent_map **em_cached)
    2708                 :            : {
    2709                 :            :         struct extent_map *em;
    2710                 :            : 
    2711 [ #  # ][ #  # ]:          0 :         if (em_cached && *em_cached) {
    2712                 :            :                 em = *em_cached;
    2713 [ #  # ][ #  # ]:          0 :                 if (em->in_tree && start >= em->start &&
                 [ #  # ]
    2714                 :            :                     start < extent_map_end(em)) {
    2715                 :          0 :                         atomic_inc(&em->refs);
    2716                 :          0 :                         return em;
    2717                 :            :                 }
    2718                 :            : 
    2719                 :          0 :                 free_extent_map(em);
    2720                 :          0 :                 *em_cached = NULL;
    2721                 :            :         }
    2722                 :            : 
    2723                 :          0 :         em = get_extent(inode, page, pg_offset, start, len, 0);
    2724 [ #  # ][ #  # ]:          0 :         if (em_cached && !IS_ERR_OR_NULL(em)) {
    2725         [ #  # ]:          0 :                 BUG_ON(*em_cached);
    2726                 :          0 :                 atomic_inc(&em->refs);
    2727                 :          0 :                 *em_cached = em;
    2728                 :            :         }
    2729                 :          0 :         return em;
    2730                 :            : }
    2731                 :            : /*
    2732                 :            :  * basic readpage implementation.  Locked extent state structs are inserted
    2733                 :            :  * into the tree that are removed when the IO is done (by the end_io
    2734                 :            :  * handlers)
    2735                 :            :  * XXX JDM: This needs looking at to ensure proper page locking
    2736                 :            :  */
    2737                 :          0 : static int __do_readpage(struct extent_io_tree *tree,
    2738                 :          0 :                          struct page *page,
    2739                 :            :                          get_extent_t *get_extent,
    2740                 :            :                          struct extent_map **em_cached,
    2741                 :            :                          struct bio **bio, int mirror_num,
    2742                 :            :                          unsigned long *bio_flags, int rw)
    2743                 :            : {
    2744                 :          0 :         struct inode *inode = page->mapping->host;
    2745                 :          0 :         u64 start = page_offset(page);
    2746                 :          0 :         u64 page_end = start + PAGE_CACHE_SIZE - 1;
    2747                 :            :         u64 end;
    2748                 :            :         u64 cur = start;
    2749                 :            :         u64 extent_offset;
    2750                 :          0 :         u64 last_byte = i_size_read(inode);
    2751                 :            :         u64 block_start;
    2752                 :            :         u64 cur_end;
    2753                 :            :         sector_t sector;
    2754                 :            :         struct extent_map *em;
    2755                 :            :         struct block_device *bdev;
    2756                 :            :         int ret;
    2757                 :            :         int nr = 0;
    2758                 :          0 :         int parent_locked = *bio_flags & EXTENT_BIO_PARENT_LOCKED;
    2759                 :            :         size_t pg_offset = 0;
    2760                 :            :         size_t iosize;
    2761                 :            :         size_t disk_io_size;
    2762                 :          0 :         size_t blocksize = inode->i_sb->s_blocksize;
    2763                 :          0 :         unsigned long this_bio_flag = *bio_flags & EXTENT_BIO_PARENT_LOCKED;
    2764                 :            : 
    2765                 :          0 :         set_page_extent_mapped(page);
    2766                 :            : 
    2767                 :            :         end = page_end;
    2768                 :            :         if (!PageUptodate(page)) {
    2769                 :            :                 if (cleancache_get_page(page) == 0) {
    2770                 :            :                         BUG_ON(blocksize != PAGE_SIZE);
    2771                 :            :                         unlock_extent(tree, start, end);
    2772                 :            :                         goto out;
    2773                 :            :                 }
    2774                 :            :         }
    2775                 :            : 
    2776         [ #  # ]:          0 :         if (page->index == last_byte >> PAGE_CACHE_SHIFT) {
    2777                 :            :                 char *userpage;
    2778                 :          0 :                 size_t zero_offset = last_byte & (PAGE_CACHE_SIZE - 1);
    2779                 :            : 
    2780         [ #  # ]:          0 :                 if (zero_offset) {
    2781                 :          0 :                         iosize = PAGE_CACHE_SIZE - zero_offset;
    2782                 :          0 :                         userpage = kmap_atomic(page);
    2783         [ #  # ]:          0 :                         memset(userpage + zero_offset, 0, iosize);
    2784                 :          0 :                         flush_dcache_page(page);
    2785                 :          0 :                         kunmap_atomic(userpage);
    2786                 :            :                 }
    2787                 :            :         }
    2788         [ #  # ]:          0 :         while (cur <= end) {
    2789                 :            :                 unsigned long pnr = (last_byte >> PAGE_CACHE_SHIFT) + 1;
    2790                 :            : 
    2791         [ #  # ]:          0 :                 if (cur >= last_byte) {
    2792                 :            :                         char *userpage;
    2793                 :          0 :                         struct extent_state *cached = NULL;
    2794                 :            : 
    2795                 :          0 :                         iosize = PAGE_CACHE_SIZE - pg_offset;
    2796                 :          0 :                         userpage = kmap_atomic(page);
    2797         [ #  # ]:          0 :                         memset(userpage + pg_offset, 0, iosize);
    2798                 :          0 :                         flush_dcache_page(page);
    2799                 :          0 :                         kunmap_atomic(userpage);
    2800                 :          0 :                         set_extent_uptodate(tree, cur, cur + iosize - 1,
    2801                 :            :                                             &cached, GFP_NOFS);
    2802         [ #  # ]:          0 :                         if (!parent_locked)
    2803                 :            :                                 unlock_extent_cached(tree, cur,
    2804                 :            :                                                      cur + iosize - 1,
    2805                 :            :                                                      &cached, GFP_NOFS);
    2806                 :            :                         break;
    2807                 :            :                 }
    2808                 :          0 :                 em = __get_extent_map(inode, page, pg_offset, cur,
    2809                 :          0 :                                       end - cur + 1, get_extent, em_cached);
    2810         [ #  # ]:          0 :                 if (IS_ERR_OR_NULL(em)) {
    2811                 :            :                         SetPageError(page);
    2812         [ #  # ]:          0 :                         if (!parent_locked)
    2813                 :          0 :                                 unlock_extent(tree, cur, end);
    2814                 :            :                         break;
    2815                 :            :                 }
    2816                 :          0 :                 extent_offset = cur - em->start;
    2817         [ #  # ]:          0 :                 BUG_ON(extent_map_end(em) <= cur);
    2818         [ #  # ]:          0 :                 BUG_ON(end < cur);
    2819                 :            : 
    2820         [ #  # ]:          0 :                 if (test_bit(EXTENT_FLAG_COMPRESSED, &em->flags)) {
    2821                 :          0 :                         this_bio_flag |= EXTENT_BIO_COMPRESSED;
    2822                 :          0 :                         extent_set_compress_type(&this_bio_flag,
    2823                 :          0 :                                                  em->compress_type);
    2824                 :            :                 }
    2825                 :            : 
    2826                 :          0 :                 iosize = min(extent_map_end(em) - cur, end - cur + 1);
    2827                 :          0 :                 cur_end = min(extent_map_end(em) - 1, end);
    2828                 :          0 :                 iosize = ALIGN(iosize, blocksize);
    2829         [ #  # ]:          0 :                 if (this_bio_flag & EXTENT_BIO_COMPRESSED) {
    2830                 :          0 :                         disk_io_size = em->block_len;
    2831                 :          0 :                         sector = em->block_start >> 9;
    2832                 :            :                 } else {
    2833                 :          0 :                         sector = (em->block_start + extent_offset) >> 9;
    2834                 :            :                         disk_io_size = iosize;
    2835                 :            :                 }
    2836                 :          0 :                 bdev = em->bdev;
    2837                 :          0 :                 block_start = em->block_start;
    2838         [ #  # ]:          0 :                 if (test_bit(EXTENT_FLAG_PREALLOC, &em->flags))
    2839                 :            :                         block_start = EXTENT_MAP_HOLE;
    2840                 :          0 :                 free_extent_map(em);
    2841                 :            :                 em = NULL;
    2842                 :            : 
    2843                 :            :                 /* we've found a hole, just zero and go on */
    2844         [ #  # ]:          0 :                 if (block_start == EXTENT_MAP_HOLE) {
    2845                 :            :                         char *userpage;
    2846                 :          0 :                         struct extent_state *cached = NULL;
    2847                 :            : 
    2848                 :          0 :                         userpage = kmap_atomic(page);
    2849         [ #  # ]:          0 :                         memset(userpage + pg_offset, 0, iosize);
    2850                 :          0 :                         flush_dcache_page(page);
    2851                 :          0 :                         kunmap_atomic(userpage);
    2852                 :            : 
    2853                 :          0 :                         set_extent_uptodate(tree, cur, cur + iosize - 1,
    2854                 :            :                                             &cached, GFP_NOFS);
    2855                 :            :                         unlock_extent_cached(tree, cur, cur + iosize - 1,
    2856                 :            :                                              &cached, GFP_NOFS);
    2857                 :            :                         cur = cur + iosize;
    2858                 :          0 :                         pg_offset += iosize;
    2859                 :          0 :                         continue;
    2860                 :            :                 }
    2861                 :            :                 /* the get_extent function already copied into the page */
    2862         [ #  # ]:          0 :                 if (test_range_bit(tree, cur, cur_end,
    2863                 :            :                                    EXTENT_UPTODATE, 1, NULL)) {
    2864                 :          0 :                         check_page_uptodate(tree, page);
    2865         [ #  # ]:          0 :                         if (!parent_locked)
    2866                 :          0 :                                 unlock_extent(tree, cur, cur + iosize - 1);
    2867                 :          0 :                         cur = cur + iosize;
    2868                 :          0 :                         pg_offset += iosize;
    2869                 :          0 :                         continue;
    2870                 :            :                 }
    2871                 :            :                 /* we have an inline extent but it didn't get marked up
    2872                 :            :                  * to date.  Error out
    2873                 :            :                  */
    2874         [ #  # ]:          0 :                 if (block_start == EXTENT_MAP_INLINE) {
    2875                 :            :                         SetPageError(page);
    2876         [ #  # ]:          0 :                         if (!parent_locked)
    2877                 :          0 :                                 unlock_extent(tree, cur, cur + iosize - 1);
    2878                 :          0 :                         cur = cur + iosize;
    2879                 :          0 :                         pg_offset += iosize;
    2880                 :          0 :                         continue;
    2881                 :            :                 }
    2882                 :            : 
    2883                 :            :                 pnr -= page->index;
    2884                 :          0 :                 ret = submit_extent_page(rw, tree, page,
    2885                 :            :                                          sector, disk_io_size, pg_offset,
    2886                 :            :                                          bdev, bio, pnr,
    2887                 :            :                                          end_bio_extent_readpage, mirror_num,
    2888                 :            :                                          *bio_flags,
    2889                 :            :                                          this_bio_flag);
    2890         [ #  # ]:          0 :                 if (!ret) {
    2891                 :          0 :                         nr++;
    2892                 :          0 :                         *bio_flags = this_bio_flag;
    2893                 :            :                 } else {
    2894                 :            :                         SetPageError(page);
    2895         [ #  # ]:          0 :                         if (!parent_locked)
    2896                 :          0 :                                 unlock_extent(tree, cur, cur + iosize - 1);
    2897                 :            :                 }
    2898                 :          0 :                 cur = cur + iosize;
    2899                 :          0 :                 pg_offset += iosize;
    2900                 :            :         }
    2901                 :            : out:
    2902         [ #  # ]:          0 :         if (!nr) {
    2903         [ #  # ]:          0 :                 if (!PageError(page))
    2904                 :            :                         SetPageUptodate(page);
    2905                 :          0 :                 unlock_page(page);
    2906                 :            :         }
    2907                 :          0 :         return 0;
    2908                 :            : }
    2909                 :            : 
    2910                 :            : static inline void __do_contiguous_readpages(struct extent_io_tree *tree,
    2911                 :            :                                              struct page *pages[], int nr_pages,
    2912                 :            :                                              u64 start, u64 end,
    2913                 :            :                                              get_extent_t *get_extent,
    2914                 :            :                                              struct extent_map **em_cached,
    2915                 :            :                                              struct bio **bio, int mirror_num,
    2916                 :            :                                              unsigned long *bio_flags, int rw)
    2917                 :            : {
    2918                 :            :         struct inode *inode;
    2919                 :            :         struct btrfs_ordered_extent *ordered;
    2920                 :            :         int index;
    2921                 :            : 
    2922                 :          0 :         inode = pages[0]->mapping->host;
    2923                 :            :         while (1) {
    2924                 :          0 :                 lock_extent(tree, start, end);
    2925                 :          0 :                 ordered = btrfs_lookup_ordered_range(inode, start,
    2926                 :          0 :                                                      end - start + 1);
    2927 [ #  # ][ #  # ]:          0 :                 if (!ordered)
    2928                 :            :                         break;
    2929                 :          0 :                 unlock_extent(tree, start, end);
    2930                 :          0 :                 btrfs_start_ordered_extent(inode, ordered, 1);
    2931                 :          0 :                 btrfs_put_ordered_extent(ordered);
    2932                 :            :         }
    2933                 :            : 
    2934 [ #  # ][ #  # ]:          0 :         for (index = 0; index < nr_pages; index++) {
    2935                 :          0 :                 __do_readpage(tree, pages[index], get_extent, em_cached, bio,
    2936                 :            :                               mirror_num, bio_flags, rw);
    2937                 :          0 :                 page_cache_release(pages[index]);
    2938                 :            :         }
    2939                 :            : }
    2940                 :            : 
    2941                 :          0 : static void __extent_readpages(struct extent_io_tree *tree,
    2942                 :            :                                struct page *pages[],
    2943                 :            :                                int nr_pages, get_extent_t *get_extent,
    2944                 :            :                                struct extent_map **em_cached,
    2945                 :            :                                struct bio **bio, int mirror_num,
    2946                 :            :                                unsigned long *bio_flags, int rw)
    2947                 :            : {
    2948                 :            :         u64 start = 0;
    2949                 :            :         u64 end = 0;
    2950                 :            :         u64 page_start;
    2951                 :            :         int index;
    2952                 :            :         int first_index = 0;
    2953                 :            : 
    2954         [ #  # ]:          0 :         for (index = 0; index < nr_pages; index++) {
    2955                 :          0 :                 page_start = page_offset(pages[index]);
    2956         [ #  # ]:          0 :                 if (!end) {
    2957                 :            :                         start = page_start;
    2958                 :          0 :                         end = start + PAGE_CACHE_SIZE - 1;
    2959                 :            :                         first_index = index;
    2960         [ #  # ]:          0 :                 } else if (end + 1 == page_start) {
    2961                 :          0 :                         end += PAGE_CACHE_SIZE;
    2962                 :            :                 } else {
    2963                 :          0 :                         __do_contiguous_readpages(tree, &pages[first_index],
    2964                 :            :                                                   index - first_index, start,
    2965                 :            :                                                   end, get_extent, em_cached,
    2966                 :            :                                                   bio, mirror_num, bio_flags,
    2967                 :            :                                                   rw);
    2968                 :            :                         start = page_start;
    2969                 :          0 :                         end = start + PAGE_CACHE_SIZE - 1;
    2970                 :            :                         first_index = index;
    2971                 :            :                 }
    2972                 :            :         }
    2973                 :            : 
    2974         [ #  # ]:          0 :         if (end)
    2975                 :          0 :                 __do_contiguous_readpages(tree, &pages[first_index],
    2976                 :            :                                           index - first_index, start,
    2977                 :            :                                           end, get_extent, em_cached, bio,
    2978                 :            :                                           mirror_num, bio_flags, rw);
    2979                 :          0 : }
    2980                 :            : 
    2981                 :          0 : static int __extent_read_full_page(struct extent_io_tree *tree,
    2982                 :          0 :                                    struct page *page,
    2983                 :            :                                    get_extent_t *get_extent,
    2984                 :            :                                    struct bio **bio, int mirror_num,
    2985                 :            :                                    unsigned long *bio_flags, int rw)
    2986                 :            : {
    2987                 :          0 :         struct inode *inode = page->mapping->host;
    2988                 :            :         struct btrfs_ordered_extent *ordered;
    2989                 :          0 :         u64 start = page_offset(page);
    2990                 :          0 :         u64 end = start + PAGE_CACHE_SIZE - 1;
    2991                 :            :         int ret;
    2992                 :            : 
    2993                 :            :         while (1) {
    2994                 :            :                 lock_extent(tree, start, end);
    2995                 :          0 :                 ordered = btrfs_lookup_ordered_extent(inode, start);
    2996         [ #  # ]:          0 :                 if (!ordered)
    2997                 :            :                         break;
    2998                 :          0 :                 unlock_extent(tree, start, end);
    2999                 :          0 :                 btrfs_start_ordered_extent(inode, ordered, 1);
    3000                 :          0 :                 btrfs_put_ordered_extent(ordered);
    3001                 :          0 :         }
    3002                 :            : 
    3003                 :          0 :         ret = __do_readpage(tree, page, get_extent, NULL, bio, mirror_num,
    3004                 :            :                             bio_flags, rw);
    3005                 :          0 :         return ret;
    3006                 :            : }
    3007                 :            : 
    3008                 :          0 : int extent_read_full_page(struct extent_io_tree *tree, struct page *page,
    3009                 :            :                             get_extent_t *get_extent, int mirror_num)
    3010                 :            : {
    3011                 :          0 :         struct bio *bio = NULL;
    3012                 :          0 :         unsigned long bio_flags = 0;
    3013                 :            :         int ret;
    3014                 :            : 
    3015                 :          0 :         ret = __extent_read_full_page(tree, page, get_extent, &bio, mirror_num,
    3016                 :            :                                       &bio_flags, READ);
    3017         [ #  # ]:          0 :         if (bio)
    3018                 :          0 :                 ret = submit_one_bio(READ, bio, mirror_num, bio_flags);
    3019                 :          0 :         return ret;
    3020                 :            : }
    3021                 :            : 
    3022                 :          0 : int extent_read_full_page_nolock(struct extent_io_tree *tree, struct page *page,
    3023                 :            :                                  get_extent_t *get_extent, int mirror_num)
    3024                 :            : {
    3025                 :          0 :         struct bio *bio = NULL;
    3026                 :          0 :         unsigned long bio_flags = EXTENT_BIO_PARENT_LOCKED;
    3027                 :            :         int ret;
    3028                 :            : 
    3029                 :          0 :         ret = __do_readpage(tree, page, get_extent, NULL, &bio, mirror_num,
    3030                 :            :                                       &bio_flags, READ);
    3031         [ #  # ]:          0 :         if (bio)
    3032                 :          0 :                 ret = submit_one_bio(READ, bio, mirror_num, bio_flags);
    3033                 :          0 :         return ret;
    3034                 :            : }
    3035                 :            : 
    3036                 :          0 : static noinline void update_nr_written(struct page *page,
    3037                 :            :                                       struct writeback_control *wbc,
    3038                 :            :                                       unsigned long nr_written)
    3039                 :            : {
    3040                 :          0 :         wbc->nr_to_write -= nr_written;
    3041 [ #  # ][ #  # ]:          0 :         if (wbc->range_cyclic || (wbc->nr_to_write > 0 &&
                 [ #  # ]
    3042         [ #  # ]:          0 :             wbc->range_start == 0 && wbc->range_end == LLONG_MAX))
    3043                 :          0 :                 page->mapping->writeback_index = page->index + nr_written;
    3044                 :          0 : }
    3045                 :            : 
    3046                 :            : /*
    3047                 :            :  * the writepage semantics are similar to regular writepage.  extent
    3048                 :            :  * records are inserted to lock ranges in the tree, and as dirty areas
    3049                 :            :  * are found, they are marked writeback.  Then the lock bits are removed
    3050                 :            :  * and the end_io handler clears the writeback ranges
    3051                 :            :  */
    3052                 :          0 : static int __extent_writepage(struct page *page, struct writeback_control *wbc,
    3053                 :            :                               void *data)
    3054                 :            : {
    3055                 :          0 :         struct inode *inode = page->mapping->host;
    3056                 :            :         struct extent_page_data *epd = data;
    3057                 :          0 :         struct extent_io_tree *tree = epd->tree;
    3058                 :          0 :         u64 start = page_offset(page);
    3059                 :            :         u64 delalloc_start;
    3060                 :          0 :         u64 page_end = start + PAGE_CACHE_SIZE - 1;
    3061                 :            :         u64 end;
    3062                 :            :         u64 cur = start;
    3063                 :            :         u64 extent_offset;
    3064                 :          0 :         u64 last_byte = i_size_read(inode);
    3065                 :            :         u64 block_start;
    3066                 :            :         u64 iosize;
    3067                 :            :         sector_t sector;
    3068                 :            :         struct extent_state *cached_state = NULL;
    3069                 :            :         struct extent_map *em;
    3070                 :            :         struct block_device *bdev;
    3071                 :            :         int ret;
    3072                 :            :         int nr = 0;
    3073                 :            :         size_t pg_offset = 0;
    3074                 :            :         size_t blocksize;
    3075                 :            :         loff_t i_size = i_size_read(inode);
    3076                 :          0 :         unsigned long end_index = i_size >> PAGE_CACHE_SHIFT;
    3077                 :            :         u64 nr_delalloc;
    3078                 :            :         u64 delalloc_end;
    3079                 :            :         int page_started;
    3080                 :            :         int compressed;
    3081                 :            :         int write_flags;
    3082                 :          0 :         unsigned long nr_written = 0;
    3083                 :            :         bool fill_delalloc = true;
    3084                 :            : 
    3085         [ #  # ]:          0 :         if (wbc->sync_mode == WB_SYNC_ALL)
    3086                 :            :                 write_flags = WRITE_SYNC;
    3087                 :            :         else
    3088                 :            :                 write_flags = WRITE;
    3089                 :            : 
    3090                 :            :         trace___extent_writepage(page, inode, wbc);
    3091                 :            : 
    3092         [ #  # ]:          0 :         WARN_ON(!PageLocked(page));
    3093                 :            : 
    3094                 :            :         ClearPageError(page);
    3095                 :            : 
    3096                 :          0 :         pg_offset = i_size & (PAGE_CACHE_SIZE - 1);
    3097 [ #  # ][ #  # ]:          0 :         if (page->index > end_index ||
    3098         [ #  # ]:          0 :            (page->index == end_index && !pg_offset)) {
    3099                 :          0 :                 page->mapping->a_ops->invalidatepage(page, 0, PAGE_CACHE_SIZE);
    3100                 :          0 :                 unlock_page(page);
    3101                 :          0 :                 return 0;
    3102                 :            :         }
    3103                 :            : 
    3104         [ #  # ]:          0 :         if (page->index == end_index) {
    3105                 :            :                 char *userpage;
    3106                 :            : 
    3107                 :          0 :                 userpage = kmap_atomic(page);
    3108         [ #  # ]:          0 :                 memset(userpage + pg_offset, 0,
    3109                 :            :                        PAGE_CACHE_SIZE - pg_offset);
    3110                 :          0 :                 kunmap_atomic(userpage);
    3111                 :          0 :                 flush_dcache_page(page);
    3112                 :            :         }
    3113                 :            :         pg_offset = 0;
    3114                 :            : 
    3115                 :          0 :         set_page_extent_mapped(page);
    3116                 :            : 
    3117 [ #  # ][ #  # ]:          0 :         if (!tree->ops || !tree->ops->fill_delalloc)
    3118                 :            :                 fill_delalloc = false;
    3119                 :            : 
    3120                 :          0 :         delalloc_start = start;
    3121                 :          0 :         delalloc_end = 0;
    3122                 :          0 :         page_started = 0;
    3123 [ #  # ][ #  # ]:          0 :         if (!epd->extent_locked && fill_delalloc) {
    3124                 :            :                 u64 delalloc_to_write = 0;
    3125                 :            :                 /*
    3126                 :            :                  * make sure the wbc mapping index is at least updated
    3127                 :            :                  * to this page.
    3128                 :            :                  */
    3129                 :          0 :                 update_nr_written(page, wbc, 0);
    3130                 :            : 
    3131         [ #  # ]:          0 :                 while (delalloc_end < page_end) {
    3132                 :          0 :                         nr_delalloc = find_lock_delalloc_range(inode, tree,
    3133                 :            :                                                        page,
    3134                 :            :                                                        &delalloc_start,
    3135                 :            :                                                        &delalloc_end,
    3136                 :            :                                                        128 * 1024 * 1024);
    3137         [ #  # ]:          0 :                         if (nr_delalloc == 0) {
    3138                 :          0 :                                 delalloc_start = delalloc_end + 1;
    3139                 :          0 :                                 continue;
    3140                 :            :                         }
    3141                 :          0 :                         ret = tree->ops->fill_delalloc(inode, page,
    3142                 :            :                                                        delalloc_start,
    3143                 :            :                                                        delalloc_end,
    3144                 :            :                                                        &page_started,
    3145                 :            :                                                        &nr_written);
    3146                 :            :                         /* File system has been set read-only */
    3147         [ #  # ]:          0 :                         if (ret) {
    3148                 :            :                                 SetPageError(page);
    3149                 :            :                                 goto done;
    3150                 :            :                         }
    3151                 :            :                         /*
    3152                 :            :                          * delalloc_end is already one less than the total
    3153                 :            :                          * length, so we don't subtract one from
    3154                 :            :                          * PAGE_CACHE_SIZE
    3155                 :            :                          */
    3156                 :          0 :                         delalloc_to_write += (delalloc_end - delalloc_start +
    3157                 :          0 :                                               PAGE_CACHE_SIZE) >>
    3158                 :            :                                               PAGE_CACHE_SHIFT;
    3159                 :          0 :                         delalloc_start = delalloc_end + 1;
    3160                 :            :                 }
    3161         [ #  # ]:          0 :                 if (wbc->nr_to_write < delalloc_to_write) {
    3162                 :            :                         int thresh = 8192;
    3163                 :            : 
    3164         [ #  # ]:          0 :                         if (delalloc_to_write < thresh * 2)
    3165                 :          0 :                                 thresh = delalloc_to_write;
    3166                 :          0 :                         wbc->nr_to_write = min_t(u64, delalloc_to_write,
    3167                 :            :                                                  thresh);
    3168                 :            :                 }
    3169                 :            : 
    3170                 :            :                 /* did the fill delalloc function already unlock and start
    3171                 :            :                  * the IO?
    3172                 :            :                  */
    3173         [ #  # ]:          0 :                 if (page_started) {
    3174                 :            :                         ret = 0;
    3175                 :            :                         /*
    3176                 :            :                          * we've unlocked the page, so we can't update
    3177                 :            :                          * the mapping's writeback index, just update
    3178                 :            :                          * nr_to_write.
    3179                 :            :                          */
    3180                 :          0 :                         wbc->nr_to_write -= nr_written;
    3181                 :          0 :                         goto done_unlocked;
    3182                 :            :                 }
    3183                 :            :         }
    3184 [ #  # ][ #  # ]:          0 :         if (tree->ops && tree->ops->writepage_start_hook) {
    3185                 :          0 :                 ret = tree->ops->writepage_start_hook(page, start,
    3186                 :            :                                                       page_end);
    3187         [ #  # ]:          0 :                 if (ret) {
    3188                 :            :                         /* Fixup worker will requeue */
    3189         [ #  # ]:          0 :                         if (ret == -EBUSY)
    3190                 :          0 :                                 wbc->pages_skipped++;
    3191                 :            :                         else
    3192                 :          0 :                                 redirty_page_for_writepage(wbc, page);
    3193                 :          0 :                         update_nr_written(page, wbc, nr_written);
    3194                 :          0 :                         unlock_page(page);
    3195                 :            :                         ret = 0;
    3196                 :          0 :                         goto done_unlocked;
    3197                 :            :                 }
    3198                 :            :         }
    3199                 :            : 
    3200                 :            :         /*
    3201                 :            :          * we don't want to touch the inode after unlocking the page,
    3202                 :            :          * so we update the mapping writeback index now
    3203                 :            :          */
    3204                 :          0 :         update_nr_written(page, wbc, nr_written + 1);
    3205                 :            : 
    3206                 :            :         end = page_end;
    3207         [ #  # ]:          0 :         if (last_byte <= start) {
    3208 [ #  # ][ #  # ]:          0 :                 if (tree->ops && tree->ops->writepage_end_io_hook)
    3209                 :          0 :                         tree->ops->writepage_end_io_hook(page, start,
    3210                 :            :                                                          page_end, NULL, 1);
    3211                 :            :                 goto done;
    3212                 :            :         }
    3213                 :            : 
    3214                 :          0 :         blocksize = inode->i_sb->s_blocksize;
    3215                 :            : 
    3216         [ #  # ]:          0 :         while (cur <= end) {
    3217         [ #  # ]:          0 :                 if (cur >= last_byte) {
    3218 [ #  # ][ #  # ]:          0 :                         if (tree->ops && tree->ops->writepage_end_io_hook)
    3219                 :          0 :                                 tree->ops->writepage_end_io_hook(page, cur,
    3220                 :            :                                                          page_end, NULL, 1);
    3221                 :            :                         break;
    3222                 :            :                 }
    3223                 :          0 :                 em = epd->get_extent(inode, page, pg_offset, cur,
    3224                 :          0 :                                      end - cur + 1, 1);
    3225         [ #  # ]:          0 :                 if (IS_ERR_OR_NULL(em)) {
    3226                 :            :                         SetPageError(page);
    3227                 :            :                         break;
    3228                 :            :                 }
    3229                 :            : 
    3230                 :          0 :                 extent_offset = cur - em->start;
    3231         [ #  # ]:          0 :                 BUG_ON(extent_map_end(em) <= cur);
    3232         [ #  # ]:          0 :                 BUG_ON(end < cur);
    3233                 :          0 :                 iosize = min(extent_map_end(em) - cur, end - cur + 1);
    3234                 :          0 :                 iosize = ALIGN(iosize, blocksize);
    3235                 :          0 :                 sector = (em->block_start + extent_offset) >> 9;
    3236                 :          0 :                 bdev = em->bdev;
    3237                 :            :                 block_start = em->block_start;
    3238                 :            :                 compressed = test_bit(EXTENT_FLAG_COMPRESSED, &em->flags);
    3239                 :          0 :                 free_extent_map(em);
    3240                 :            :                 em = NULL;
    3241                 :            : 
    3242                 :            :                 /*
    3243                 :            :                  * compressed and inline extents are written through other
    3244                 :            :                  * paths in the FS
    3245                 :            :                  */
    3246 [ #  # ][ #  # ]:          0 :                 if (compressed || block_start == EXTENT_MAP_HOLE ||
    3247                 :            :                     block_start == EXTENT_MAP_INLINE) {
    3248                 :            :                         /*
    3249                 :            :                          * end_io notification does not happen here for
    3250                 :            :                          * compressed extents
    3251                 :            :                          */
    3252 [ #  # ][ #  # ]:          0 :                         if (!compressed && tree->ops &&
                 [ #  # ]
    3253                 :          0 :                             tree->ops->writepage_end_io_hook)
    3254                 :          0 :                                 tree->ops->writepage_end_io_hook(page, cur,
    3255                 :          0 :                                                          cur + iosize - 1,
    3256                 :            :                                                          NULL, 1);
    3257         [ #  # ]:          0 :                         else if (compressed) {
    3258                 :            :                                 /* we don't want to end_page_writeback on
    3259                 :            :                                  * a compressed extent.  this happens
    3260                 :            :                                  * elsewhere
    3261                 :            :                                  */
    3262                 :          0 :                                 nr++;
    3263                 :            :                         }
    3264                 :            : 
    3265                 :          0 :                         cur += iosize;
    3266                 :          0 :                         pg_offset += iosize;
    3267                 :          0 :                         continue;
    3268                 :            :                 }
    3269                 :            :                 /* leave this out until we have a page_mkwrite call */
    3270                 :            :                 if (0 && !test_range_bit(tree, cur, cur + iosize - 1,
    3271                 :            :                                    EXTENT_DIRTY, 0, NULL)) {
    3272                 :            :                         cur = cur + iosize;
    3273                 :            :                         pg_offset += iosize;
    3274                 :            :                         continue;
    3275                 :            :                 }
    3276                 :            : 
    3277 [ #  # ][ #  # ]:          0 :                 if (tree->ops && tree->ops->writepage_io_hook) {
    3278                 :          0 :                         ret = tree->ops->writepage_io_hook(page, cur,
    3279                 :          0 :                                                 cur + iosize - 1);
    3280                 :            :                 } else {
    3281                 :            :                         ret = 0;
    3282                 :            :                 }
    3283         [ #  # ]:          0 :                 if (ret) {
    3284                 :            :                         SetPageError(page);
    3285                 :            :                 } else {
    3286                 :            :                         unsigned long max_nr = end_index + 1;
    3287                 :            : 
    3288                 :          0 :                         set_range_writeback(tree, cur, cur + iosize - 1);
    3289         [ #  # ]:          0 :                         if (!PageWriteback(page)) {
    3290                 :          0 :                                 printk(KERN_ERR "btrfs warning page %lu not "
    3291                 :            :                                        "writeback, cur %llu end %llu\n",
    3292                 :            :                                        page->index, cur, end);
    3293                 :            :                         }
    3294                 :            : 
    3295                 :          0 :                         ret = submit_extent_page(write_flags, tree, page,
    3296                 :            :                                                  sector, iosize, pg_offset,
    3297                 :            :                                                  bdev, &epd->bio, max_nr,
    3298                 :            :                                                  end_bio_extent_writepage,
    3299                 :            :                                                  0, 0, 0);
    3300         [ #  # ]:          0 :                         if (ret)
    3301                 :            :                                 SetPageError(page);
    3302                 :            :                 }
    3303                 :          0 :                 cur = cur + iosize;
    3304                 :          0 :                 pg_offset += iosize;
    3305                 :          0 :                 nr++;
    3306                 :            :         }
    3307                 :            : done:
    3308         [ #  # ]:          0 :         if (nr == 0) {
    3309                 :            :                 /* make sure the mapping tag for page dirty gets cleared */
    3310                 :            :                 set_page_writeback(page);
    3311                 :          0 :                 end_page_writeback(page);
    3312                 :            :         }
    3313                 :          0 :         unlock_page(page);
    3314                 :            : 
    3315                 :            : done_unlocked:
    3316                 :            : 
    3317                 :            :         /* drop our reference on any cached states */
    3318                 :          0 :         free_extent_state(cached_state);
    3319                 :          0 :         return 0;
    3320                 :            : }
    3321                 :            : 
    3322                 :          0 : static int eb_wait(void *word)
    3323                 :            : {
    3324                 :          0 :         io_schedule();
    3325                 :          0 :         return 0;
    3326                 :            : }
    3327                 :            : 
    3328                 :          0 : void wait_on_extent_buffer_writeback(struct extent_buffer *eb)
    3329                 :            : {
    3330                 :          0 :         wait_on_bit(&eb->bflags, EXTENT_BUFFER_WRITEBACK, eb_wait,
    3331                 :            :                     TASK_UNINTERRUPTIBLE);
    3332                 :          0 : }
    3333                 :            : 
    3334                 :          0 : static int lock_extent_buffer_for_io(struct extent_buffer *eb,
    3335                 :            :                                      struct btrfs_fs_info *fs_info,
    3336                 :            :                                      struct extent_page_data *epd)
    3337                 :            : {
    3338                 :            :         unsigned long i, num_pages;
    3339                 :            :         int flush = 0;
    3340                 :            :         int ret = 0;
    3341                 :            : 
    3342         [ #  # ]:          0 :         if (!btrfs_try_tree_write_lock(eb)) {
    3343                 :            :                 flush = 1;
    3344                 :          0 :                 flush_write_bio(epd);
    3345                 :          0 :                 btrfs_tree_lock(eb);
    3346                 :            :         }
    3347                 :            : 
    3348         [ #  # ]:          0 :         if (test_bit(EXTENT_BUFFER_WRITEBACK, &eb->bflags)) {
    3349                 :          0 :                 btrfs_tree_unlock(eb);
    3350         [ #  # ]:          0 :                 if (!epd->sync_io)
    3351                 :            :                         return 0;
    3352         [ #  # ]:          0 :                 if (!flush) {
    3353                 :          0 :                         flush_write_bio(epd);
    3354                 :            :                         flush = 1;
    3355                 :            :                 }
    3356                 :            :                 while (1) {
    3357                 :          0 :                         wait_on_extent_buffer_writeback(eb);
    3358                 :          0 :                         btrfs_tree_lock(eb);
    3359         [ #  # ]:          0 :                         if (!test_bit(EXTENT_BUFFER_WRITEBACK, &eb->bflags))
    3360                 :            :                                 break;
    3361                 :          0 :                         btrfs_tree_unlock(eb);
    3362                 :          0 :                 }
    3363                 :            :         }
    3364                 :            : 
    3365                 :            :         /*
    3366                 :            :          * We need to do this to prevent races in people who check if the eb is
    3367                 :            :          * under IO since we can end up having no IO bits set for a short period
    3368                 :            :          * of time.
    3369                 :            :          */
    3370                 :            :         spin_lock(&eb->refs_lock);
    3371         [ #  # ]:          0 :         if (test_and_clear_bit(EXTENT_BUFFER_DIRTY, &eb->bflags)) {
    3372                 :          0 :                 set_bit(EXTENT_BUFFER_WRITEBACK, &eb->bflags);
    3373                 :            :                 spin_unlock(&eb->refs_lock);
    3374                 :            :                 btrfs_set_header_flag(eb, BTRFS_HEADER_FLAG_WRITTEN);
    3375                 :          0 :                 __percpu_counter_add(&fs_info->dirty_metadata_bytes,
    3376                 :          0 :                                      -eb->len,
    3377                 :            :                                      fs_info->dirty_metadata_batch);
    3378                 :            :                 ret = 1;
    3379                 :            :         } else {
    3380                 :            :                 spin_unlock(&eb->refs_lock);
    3381                 :            :         }
    3382                 :            : 
    3383                 :          0 :         btrfs_tree_unlock(eb);
    3384                 :            : 
    3385         [ #  # ]:          0 :         if (!ret)
    3386                 :            :                 return ret;
    3387                 :            : 
    3388                 :          0 :         num_pages = num_extent_pages(eb->start, eb->len);
    3389         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    3390                 :            :                 struct page *p = extent_buffer_page(eb, i);
    3391                 :            : 
    3392         [ #  # ]:          0 :                 if (!trylock_page(p)) {
    3393         [ #  # ]:          0 :                         if (!flush) {
    3394                 :          0 :                                 flush_write_bio(epd);
    3395                 :            :                                 flush = 1;
    3396                 :            :                         }
    3397                 :            :                         lock_page(p);
    3398                 :            :                 }
    3399                 :            :         }
    3400                 :            : 
    3401                 :            :         return ret;
    3402                 :            : }
    3403                 :            : 
    3404                 :          0 : static void end_extent_buffer_writeback(struct extent_buffer *eb)
    3405                 :            : {
    3406                 :          0 :         clear_bit(EXTENT_BUFFER_WRITEBACK, &eb->bflags);
    3407                 :          0 :         smp_mb__after_clear_bit();
    3408                 :          0 :         wake_up_bit(&eb->bflags, EXTENT_BUFFER_WRITEBACK);
    3409                 :          0 : }
    3410                 :            : 
    3411                 :          0 : static void end_bio_extent_buffer_writepage(struct bio *bio, int err)
    3412                 :            : {
    3413                 :            :         int uptodate = err == 0;
    3414                 :          0 :         struct bio_vec *bvec = bio->bi_io_vec + bio->bi_vcnt - 1;
    3415                 :            :         struct extent_buffer *eb;
    3416                 :            :         int done;
    3417                 :            : 
    3418                 :            :         do {
    3419                 :          0 :                 struct page *page = bvec->bv_page;
    3420                 :            : 
    3421                 :          0 :                 bvec--;
    3422                 :          0 :                 eb = (struct extent_buffer *)page->private;
    3423         [ #  # ]:          0 :                 BUG_ON(!eb);
    3424                 :          0 :                 done = atomic_dec_and_test(&eb->io_pages);
    3425                 :            : 
    3426 [ #  # ][ #  # ]:          0 :                 if (!uptodate || test_bit(EXTENT_BUFFER_IOERR, &eb->bflags)) {
    3427                 :          0 :                         set_bit(EXTENT_BUFFER_IOERR, &eb->bflags);
    3428                 :            :                         ClearPageUptodate(page);
    3429                 :            :                         SetPageError(page);
    3430                 :            :                 }
    3431                 :            : 
    3432                 :          0 :                 end_page_writeback(page);
    3433                 :            : 
    3434         [ #  # ]:          0 :                 if (!done)
    3435                 :          0 :                         continue;
    3436                 :            : 
    3437                 :          0 :                 end_extent_buffer_writeback(eb);
    3438         [ #  # ]:          0 :         } while (bvec >= bio->bi_io_vec);
    3439                 :            : 
    3440                 :          0 :         bio_put(bio);
    3441                 :            : 
    3442                 :          0 : }
    3443                 :            : 
    3444                 :          0 : static int write_one_eb(struct extent_buffer *eb,
    3445                 :            :                         struct btrfs_fs_info *fs_info,
    3446                 :            :                         struct writeback_control *wbc,
    3447                 :            :                         struct extent_page_data *epd)
    3448                 :            : {
    3449                 :          0 :         struct block_device *bdev = fs_info->fs_devices->latest_bdev;
    3450                 :          0 :         u64 offset = eb->start;
    3451                 :            :         unsigned long i, num_pages;
    3452                 :            :         unsigned long bio_flags = 0;
    3453         [ #  # ]:          0 :         int rw = (epd->sync_io ? WRITE_SYNC : WRITE) | REQ_META;
    3454                 :            :         int ret = 0;
    3455                 :            : 
    3456                 :          0 :         clear_bit(EXTENT_BUFFER_IOERR, &eb->bflags);
    3457                 :          0 :         num_pages = num_extent_pages(eb->start, eb->len);
    3458                 :          0 :         atomic_set(&eb->io_pages, num_pages);
    3459         [ #  # ]:          0 :         if (btrfs_header_owner(eb) == BTRFS_TREE_LOG_OBJECTID)
    3460                 :            :                 bio_flags = EXTENT_BIO_TREE_LOG;
    3461                 :            : 
    3462         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    3463                 :            :                 struct page *p = extent_buffer_page(eb, i);
    3464                 :            : 
    3465                 :          0 :                 clear_page_dirty_for_io(p);
    3466                 :            :                 set_page_writeback(p);
    3467                 :          0 :                 ret = submit_extent_page(rw, eb->tree, p, offset >> 9,
    3468                 :            :                                          PAGE_CACHE_SIZE, 0, bdev, &epd->bio,
    3469                 :            :                                          -1, end_bio_extent_buffer_writepage,
    3470                 :            :                                          0, epd->bio_flags, bio_flags);
    3471                 :          0 :                 epd->bio_flags = bio_flags;
    3472         [ #  # ]:          0 :                 if (ret) {
    3473                 :          0 :                         set_bit(EXTENT_BUFFER_IOERR, &eb->bflags);
    3474                 :            :                         SetPageError(p);
    3475         [ #  # ]:          0 :                         if (atomic_sub_and_test(num_pages - i, &eb->io_pages))
    3476                 :          0 :                                 end_extent_buffer_writeback(eb);
    3477                 :            :                         ret = -EIO;
    3478                 :            :                         break;
    3479                 :            :                 }
    3480                 :          0 :                 offset += PAGE_CACHE_SIZE;
    3481                 :          0 :                 update_nr_written(p, wbc, 1);
    3482                 :          0 :                 unlock_page(p);
    3483                 :            :         }
    3484                 :            : 
    3485         [ #  # ]:          0 :         if (unlikely(ret)) {
    3486         [ #  # ]:          0 :                 for (; i < num_pages; i++) {
    3487                 :            :                         struct page *p = extent_buffer_page(eb, i);
    3488                 :          0 :                         unlock_page(p);
    3489                 :            :                 }
    3490                 :            :         }
    3491                 :            : 
    3492                 :          0 :         return ret;
    3493                 :            : }
    3494                 :            : 
    3495                 :          0 : int btree_write_cache_pages(struct address_space *mapping,
    3496                 :            :                                    struct writeback_control *wbc)
    3497                 :            : {
    3498                 :          0 :         struct extent_io_tree *tree = &BTRFS_I(mapping->host)->io_tree;
    3499                 :          0 :         struct btrfs_fs_info *fs_info = BTRFS_I(mapping->host)->root->fs_info;
    3500                 :            :         struct extent_buffer *eb, *prev_eb = NULL;
    3501                 :          0 :         struct extent_page_data epd = {
    3502                 :            :                 .bio = NULL,
    3503                 :            :                 .tree = tree,
    3504                 :            :                 .extent_locked = 0,
    3505                 :          0 :                 .sync_io = wbc->sync_mode == WB_SYNC_ALL,
    3506                 :            :                 .bio_flags = 0,
    3507                 :            :         };
    3508                 :            :         int ret = 0;
    3509                 :            :         int done = 0;
    3510                 :            :         int nr_to_write_done = 0;
    3511                 :            :         struct pagevec pvec;
    3512                 :            :         int nr_pages;
    3513                 :            :         pgoff_t index;
    3514                 :            :         pgoff_t end;            /* Inclusive */
    3515                 :            :         int scanned = 0;
    3516                 :            :         int tag;
    3517                 :            : 
    3518                 :            :         pagevec_init(&pvec, 0);
    3519         [ #  # ]:          0 :         if (wbc->range_cyclic) {
    3520                 :          0 :                 index = mapping->writeback_index; /* Start from prev offset */
    3521                 :            :                 end = -1;
    3522                 :            :         } else {
    3523                 :          0 :                 index = wbc->range_start >> PAGE_CACHE_SHIFT;
    3524                 :          0 :                 end = wbc->range_end >> PAGE_CACHE_SHIFT;
    3525                 :            :                 scanned = 1;
    3526                 :            :         }
    3527         [ #  # ]:          0 :         if (wbc->sync_mode == WB_SYNC_ALL)
    3528                 :            :                 tag = PAGECACHE_TAG_TOWRITE;
    3529                 :            :         else
    3530                 :            :                 tag = PAGECACHE_TAG_DIRTY;
    3531                 :            : retry:
    3532         [ #  # ]:          0 :         if (wbc->sync_mode == WB_SYNC_ALL)
    3533                 :          0 :                 tag_pages_for_writeback(mapping, index, end);
    3534         [ #  # ]:          0 :         while (!done && !nr_to_write_done && (index <= end) &&
           [ #  #  #  # ]
    3535                 :          0 :                (nr_pages = pagevec_lookup_tag(&pvec, mapping, &index, tag,
    3536                 :          0 :                         min(end - index, (pgoff_t)PAGEVEC_SIZE-1) + 1))) {
    3537                 :            :                 unsigned i;
    3538                 :            : 
    3539                 :            :                 scanned = 1;
    3540         [ #  # ]:          0 :                 for (i = 0; i < nr_pages; i++) {
    3541                 :          0 :                         struct page *page = pvec.pages[i];
    3542                 :            : 
    3543         [ #  # ]:          0 :                         if (!PagePrivate(page))
    3544                 :          0 :                                 continue;
    3545                 :            : 
    3546 [ #  # ][ #  # ]:          0 :                         if (!wbc->range_cyclic && page->index > end) {
    3547                 :            :                                 done = 1;
    3548                 :            :                                 break;
    3549                 :            :                         }
    3550                 :            : 
    3551                 :            :                         spin_lock(&mapping->private_lock);
    3552         [ #  # ]:          0 :                         if (!PagePrivate(page)) {
    3553                 :            :                                 spin_unlock(&mapping->private_lock);
    3554                 :          0 :                                 continue;
    3555                 :            :                         }
    3556                 :            : 
    3557                 :          0 :                         eb = (struct extent_buffer *)page->private;
    3558                 :            : 
    3559                 :            :                         /*
    3560                 :            :                          * Shouldn't happen and normally this would be a BUG_ON
    3561                 :            :                          * but no sense in crashing the users box for something
    3562                 :            :                          * we can survive anyway.
    3563                 :            :                          */
    3564 [ #  # ][ #  # ]:          0 :                         if (WARN_ON(!eb)) {
    3565                 :            :                                 spin_unlock(&mapping->private_lock);
    3566                 :          0 :                                 continue;
    3567                 :            :                         }
    3568                 :            : 
    3569         [ #  # ]:          0 :                         if (eb == prev_eb) {
    3570                 :            :                                 spin_unlock(&mapping->private_lock);
    3571                 :          0 :                                 continue;
    3572                 :            :                         }
    3573                 :            : 
    3574                 :          0 :                         ret = atomic_inc_not_zero(&eb->refs);
    3575                 :            :                         spin_unlock(&mapping->private_lock);
    3576         [ #  # ]:          0 :                         if (!ret)
    3577                 :          0 :                                 continue;
    3578                 :            : 
    3579                 :            :                         prev_eb = eb;
    3580                 :          0 :                         ret = lock_extent_buffer_for_io(eb, fs_info, &epd);
    3581         [ #  # ]:          0 :                         if (!ret) {
    3582                 :          0 :                                 free_extent_buffer(eb);
    3583                 :          0 :                                 continue;
    3584                 :            :                         }
    3585                 :            : 
    3586                 :          0 :                         ret = write_one_eb(eb, fs_info, wbc, &epd);
    3587         [ #  # ]:          0 :                         if (ret) {
    3588                 :            :                                 done = 1;
    3589                 :          0 :                                 free_extent_buffer(eb);
    3590                 :          0 :                                 break;
    3591                 :            :                         }
    3592                 :          0 :                         free_extent_buffer(eb);
    3593                 :            : 
    3594                 :            :                         /*
    3595                 :            :                          * the filesystem may choose to bump up nr_to_write.
    3596                 :            :                          * We have to make sure to honor the new nr_to_write
    3597                 :            :                          * at any time
    3598                 :            :                          */
    3599                 :          0 :                         nr_to_write_done = wbc->nr_to_write <= 0;
    3600                 :            :                 }
    3601                 :            :                 pagevec_release(&pvec);
    3602                 :          0 :                 cond_resched();
    3603                 :            :         }
    3604         [ #  # ]:          0 :         if (!scanned && !done) {
    3605                 :            :                 /*
    3606                 :            :                  * We hit the last page and there is more work to be done: wrap
    3607                 :            :                  * back to the start of the file
    3608                 :            :                  */
    3609                 :            :                 scanned = 1;
    3610                 :          0 :                 index = 0;
    3611                 :          0 :                 goto retry;
    3612                 :            :         }
    3613                 :          0 :         flush_write_bio(&epd);
    3614                 :          0 :         return ret;
    3615                 :            : }
    3616                 :            : 
    3617                 :            : /**
    3618                 :            :  * write_cache_pages - walk the list of dirty pages of the given address space and write all of them.
    3619                 :            :  * @mapping: address space structure to write
    3620                 :            :  * @wbc: subtract the number of written pages from *@wbc->nr_to_write
    3621                 :            :  * @writepage: function called for each page
    3622                 :            :  * @data: data passed to writepage function
    3623                 :            :  *
    3624                 :            :  * If a page is already under I/O, write_cache_pages() skips it, even
    3625                 :            :  * if it's dirty.  This is desirable behaviour for memory-cleaning writeback,
    3626                 :            :  * but it is INCORRECT for data-integrity system calls such as fsync().  fsync()
    3627                 :            :  * and msync() need to guarantee that all the data which was dirty at the time
    3628                 :            :  * the call was made get new I/O started against them.  If wbc->sync_mode is
    3629                 :            :  * WB_SYNC_ALL then we were called for data integrity and we must wait for
    3630                 :            :  * existing IO to complete.
    3631                 :            :  */
    3632                 :          0 : static int extent_write_cache_pages(struct extent_io_tree *tree,
    3633                 :            :                              struct address_space *mapping,
    3634                 :            :                              struct writeback_control *wbc,
    3635                 :            :                              writepage_t writepage, void *data,
    3636                 :            :                              void (*flush_fn)(void *))
    3637                 :            : {
    3638                 :          0 :         struct inode *inode = mapping->host;
    3639                 :            :         int ret = 0;
    3640                 :            :         int done = 0;
    3641                 :            :         int nr_to_write_done = 0;
    3642                 :            :         struct pagevec pvec;
    3643                 :            :         int nr_pages;
    3644                 :            :         pgoff_t index;
    3645                 :            :         pgoff_t end;            /* Inclusive */
    3646                 :            :         int scanned = 0;
    3647                 :            :         int tag;
    3648                 :            : 
    3649                 :            :         /*
    3650                 :            :          * We have to hold onto the inode so that ordered extents can do their
    3651                 :            :          * work when the IO finishes.  The alternative to this is failing to add
    3652                 :            :          * an ordered extent if the igrab() fails there and that is a huge pain
    3653                 :            :          * to deal with, so instead just hold onto the inode throughout the
    3654                 :            :          * writepages operation.  If it fails here we are freeing up the inode
    3655                 :            :          * anyway and we'd rather not waste our time writing out stuff that is
    3656                 :            :          * going to be truncated anyway.
    3657                 :            :          */
    3658         [ #  # ]:          0 :         if (!igrab(inode))
    3659                 :            :                 return 0;
    3660                 :            : 
    3661                 :            :         pagevec_init(&pvec, 0);
    3662         [ #  # ]:          0 :         if (wbc->range_cyclic) {
    3663                 :          0 :                 index = mapping->writeback_index; /* Start from prev offset */
    3664                 :            :                 end = -1;
    3665                 :            :         } else {
    3666                 :          0 :                 index = wbc->range_start >> PAGE_CACHE_SHIFT;
    3667                 :          0 :                 end = wbc->range_end >> PAGE_CACHE_SHIFT;
    3668                 :            :                 scanned = 1;
    3669                 :            :         }
    3670         [ #  # ]:          0 :         if (wbc->sync_mode == WB_SYNC_ALL)
    3671                 :            :                 tag = PAGECACHE_TAG_TOWRITE;
    3672                 :            :         else
    3673                 :            :                 tag = PAGECACHE_TAG_DIRTY;
    3674                 :            : retry:
    3675         [ #  # ]:          0 :         if (wbc->sync_mode == WB_SYNC_ALL)
    3676                 :          0 :                 tag_pages_for_writeback(mapping, index, end);
    3677         [ #  # ]:          0 :         while (!done && !nr_to_write_done && (index <= end) &&
           [ #  #  #  # ]
    3678                 :          0 :                (nr_pages = pagevec_lookup_tag(&pvec, mapping, &index, tag,
    3679                 :          0 :                         min(end - index, (pgoff_t)PAGEVEC_SIZE-1) + 1))) {
    3680                 :            :                 unsigned i;
    3681                 :            : 
    3682                 :            :                 scanned = 1;
    3683         [ #  # ]:          0 :                 for (i = 0; i < nr_pages; i++) {
    3684                 :          0 :                         struct page *page = pvec.pages[i];
    3685                 :            : 
    3686                 :            :                         /*
    3687                 :            :                          * At this point we hold neither mapping->tree_lock nor
    3688                 :            :                          * lock on the page itself: the page may be truncated or
    3689                 :            :                          * invalidated (changing page->mapping to NULL), or even
    3690                 :            :                          * swizzled back from swapper_space to tmpfs file
    3691                 :            :                          * mapping
    3692                 :            :                          */
    3693         [ #  # ]:          0 :                         if (!trylock_page(page)) {
    3694                 :          0 :                                 flush_fn(data);
    3695                 :            :                                 lock_page(page);
    3696                 :            :                         }
    3697                 :            : 
    3698         [ #  # ]:          0 :                         if (unlikely(page->mapping != mapping)) {
    3699                 :          0 :                                 unlock_page(page);
    3700                 :          0 :                                 continue;
    3701                 :            :                         }
    3702                 :            : 
    3703 [ #  # ][ #  # ]:          0 :                         if (!wbc->range_cyclic && page->index > end) {
    3704                 :            :                                 done = 1;
    3705                 :          0 :                                 unlock_page(page);
    3706                 :          0 :                                 continue;
    3707                 :            :                         }
    3708                 :            : 
    3709         [ #  # ]:          0 :                         if (wbc->sync_mode != WB_SYNC_NONE) {
    3710         [ #  # ]:          0 :                                 if (PageWriteback(page))
    3711                 :          0 :                                         flush_fn(data);
    3712                 :            :                                 wait_on_page_writeback(page);
    3713                 :            :                         }
    3714                 :            : 
    3715   [ #  #  #  # ]:          0 :                         if (PageWriteback(page) ||
    3716                 :          0 :                             !clear_page_dirty_for_io(page)) {
    3717                 :          0 :                                 unlock_page(page);
    3718                 :          0 :                                 continue;
    3719                 :            :                         }
    3720                 :            : 
    3721                 :          0 :                         ret = (*writepage)(page, wbc, data);
    3722                 :            : 
    3723         [ #  # ]:          0 :                         if (unlikely(ret == AOP_WRITEPAGE_ACTIVATE)) {
    3724                 :          0 :                                 unlock_page(page);
    3725                 :            :                                 ret = 0;
    3726                 :            :                         }
    3727         [ #  # ]:          0 :                         if (ret)
    3728                 :            :                                 done = 1;
    3729                 :            : 
    3730                 :            :                         /*
    3731                 :            :                          * the filesystem may choose to bump up nr_to_write.
    3732                 :            :                          * We have to make sure to honor the new nr_to_write
    3733                 :            :                          * at any time
    3734                 :            :                          */
    3735                 :          0 :                         nr_to_write_done = wbc->nr_to_write <= 0;
    3736                 :            :                 }
    3737                 :            :                 pagevec_release(&pvec);
    3738                 :          0 :                 cond_resched();
    3739                 :            :         }
    3740         [ #  # ]:          0 :         if (!scanned && !done) {
    3741                 :            :                 /*
    3742                 :            :                  * We hit the last page and there is more work to be done: wrap
    3743                 :            :                  * back to the start of the file
    3744                 :            :                  */
    3745                 :            :                 scanned = 1;
    3746                 :          0 :                 index = 0;
    3747                 :            :                 goto retry;
    3748                 :            :         }
    3749                 :          0 :         btrfs_add_delayed_iput(inode);
    3750                 :            :         return ret;
    3751                 :            : }
    3752                 :            : 
    3753                 :          0 : static void flush_epd_write_bio(struct extent_page_data *epd)
    3754                 :            : {
    3755         [ #  # ]:          0 :         if (epd->bio) {
    3756                 :            :                 int rw = WRITE;
    3757                 :            :                 int ret;
    3758                 :            : 
    3759         [ #  # ]:          0 :                 if (epd->sync_io)
    3760                 :            :                         rw = WRITE_SYNC;
    3761                 :            : 
    3762                 :          0 :                 ret = submit_one_bio(rw, epd->bio, 0, epd->bio_flags);
    3763         [ #  # ]:          0 :                 BUG_ON(ret < 0); /* -ENOMEM */
    3764                 :          0 :                 epd->bio = NULL;
    3765                 :            :         }
    3766                 :          0 : }
    3767                 :            : 
    3768                 :          0 : static noinline void flush_write_bio(void *data)
    3769                 :            : {
    3770                 :            :         struct extent_page_data *epd = data;
    3771                 :          0 :         flush_epd_write_bio(epd);
    3772                 :          0 : }
    3773                 :            : 
    3774                 :          0 : int extent_write_full_page(struct extent_io_tree *tree, struct page *page,
    3775                 :            :                           get_extent_t *get_extent,
    3776                 :            :                           struct writeback_control *wbc)
    3777                 :            : {
    3778                 :            :         int ret;
    3779                 :          0 :         struct extent_page_data epd = {
    3780                 :            :                 .bio = NULL,
    3781                 :            :                 .tree = tree,
    3782                 :            :                 .get_extent = get_extent,
    3783                 :            :                 .extent_locked = 0,
    3784                 :          0 :                 .sync_io = wbc->sync_mode == WB_SYNC_ALL,
    3785                 :            :                 .bio_flags = 0,
    3786                 :            :         };
    3787                 :            : 
    3788                 :          0 :         ret = __extent_writepage(page, wbc, &epd);
    3789                 :            : 
    3790                 :          0 :         flush_epd_write_bio(&epd);
    3791                 :          0 :         return ret;
    3792                 :            : }
    3793                 :            : 
    3794                 :          0 : int extent_write_locked_range(struct extent_io_tree *tree, struct inode *inode,
    3795                 :            :                               u64 start, u64 end, get_extent_t *get_extent,
    3796                 :            :                               int mode)
    3797                 :            : {
    3798                 :            :         int ret = 0;
    3799                 :          0 :         struct address_space *mapping = inode->i_mapping;
    3800                 :            :         struct page *page;
    3801                 :          0 :         unsigned long nr_pages = (end - start + PAGE_CACHE_SIZE) >>
    3802                 :            :                 PAGE_CACHE_SHIFT;
    3803                 :            : 
    3804                 :          0 :         struct extent_page_data epd = {
    3805                 :            :                 .bio = NULL,
    3806                 :            :                 .tree = tree,
    3807                 :            :                 .get_extent = get_extent,
    3808                 :            :                 .extent_locked = 1,
    3809                 :          0 :                 .sync_io = mode == WB_SYNC_ALL,
    3810                 :            :                 .bio_flags = 0,
    3811                 :            :         };
    3812                 :          0 :         struct writeback_control wbc_writepages = {
    3813                 :            :                 .sync_mode      = mode,
    3814                 :          0 :                 .nr_to_write    = nr_pages * 2,
    3815                 :            :                 .range_start    = start,
    3816                 :          0 :                 .range_end      = end + 1,
    3817                 :            :         };
    3818                 :            : 
    3819         [ #  # ]:          0 :         while (start <= end) {
    3820                 :          0 :                 page = find_get_page(mapping, start >> PAGE_CACHE_SHIFT);
    3821         [ #  # ]:          0 :                 if (clear_page_dirty_for_io(page))
    3822                 :          0 :                         ret = __extent_writepage(page, &wbc_writepages, &epd);
    3823                 :            :                 else {
    3824 [ #  # ][ #  # ]:          0 :                         if (tree->ops && tree->ops->writepage_end_io_hook)
    3825                 :          0 :                                 tree->ops->writepage_end_io_hook(page, start,
    3826                 :            :                                                  start + PAGE_CACHE_SIZE - 1,
    3827                 :            :                                                  NULL, 1);
    3828                 :          0 :                         unlock_page(page);
    3829                 :            :                 }
    3830                 :          0 :                 page_cache_release(page);
    3831                 :          0 :                 start += PAGE_CACHE_SIZE;
    3832                 :            :         }
    3833                 :            : 
    3834                 :          0 :         flush_epd_write_bio(&epd);
    3835                 :          0 :         return ret;
    3836                 :            : }
    3837                 :            : 
    3838                 :          0 : int extent_writepages(struct extent_io_tree *tree,
    3839                 :            :                       struct address_space *mapping,
    3840                 :            :                       get_extent_t *get_extent,
    3841                 :            :                       struct writeback_control *wbc)
    3842                 :            : {
    3843                 :            :         int ret = 0;
    3844                 :          0 :         struct extent_page_data epd = {
    3845                 :            :                 .bio = NULL,
    3846                 :            :                 .tree = tree,
    3847                 :            :                 .get_extent = get_extent,
    3848                 :            :                 .extent_locked = 0,
    3849                 :          0 :                 .sync_io = wbc->sync_mode == WB_SYNC_ALL,
    3850                 :            :                 .bio_flags = 0,
    3851                 :            :         };
    3852                 :            : 
    3853                 :          0 :         ret = extent_write_cache_pages(tree, mapping, wbc,
    3854                 :            :                                        __extent_writepage, &epd,
    3855                 :            :                                        flush_write_bio);
    3856                 :          0 :         flush_epd_write_bio(&epd);
    3857                 :          0 :         return ret;
    3858                 :            : }
    3859                 :            : 
    3860                 :          0 : int extent_readpages(struct extent_io_tree *tree,
    3861                 :            :                      struct address_space *mapping,
    3862                 :            :                      struct list_head *pages, unsigned nr_pages,
    3863                 :            :                      get_extent_t get_extent)
    3864                 :            : {
    3865                 :          0 :         struct bio *bio = NULL;
    3866                 :            :         unsigned page_idx;
    3867                 :          0 :         unsigned long bio_flags = 0;
    3868                 :            :         struct page *pagepool[16];
    3869                 :            :         struct page *page;
    3870                 :          0 :         struct extent_map *em_cached = NULL;
    3871                 :            :         int nr = 0;
    3872                 :            : 
    3873         [ #  # ]:          0 :         for (page_idx = 0; page_idx < nr_pages; page_idx++) {
    3874                 :          0 :                 page = list_entry(pages->prev, struct page, lru);
    3875                 :            : 
    3876                 :            :                 prefetchw(&page->flags);
    3877                 :            :                 list_del(&page->lru);
    3878         [ #  # ]:          0 :                 if (add_to_page_cache_lru(page, mapping,
    3879                 :            :                                         page->index, GFP_NOFS)) {
    3880                 :          0 :                         page_cache_release(page);
    3881                 :          0 :                         continue;
    3882                 :            :                 }
    3883                 :            : 
    3884                 :          0 :                 pagepool[nr++] = page;
    3885         [ #  # ]:          0 :                 if (nr < ARRAY_SIZE(pagepool))
    3886                 :          0 :                         continue;
    3887                 :          0 :                 __extent_readpages(tree, pagepool, nr, get_extent, &em_cached,
    3888                 :            :                                    &bio, 0, &bio_flags, READ);
    3889                 :            :                 nr = 0;
    3890                 :            :         }
    3891         [ #  # ]:          0 :         if (nr)
    3892                 :          0 :                 __extent_readpages(tree, pagepool, nr, get_extent, &em_cached,
    3893                 :            :                                    &bio, 0, &bio_flags, READ);
    3894                 :            : 
    3895         [ #  # ]:          0 :         if (em_cached)
    3896                 :          0 :                 free_extent_map(em_cached);
    3897                 :            : 
    3898         [ #  # ]:          0 :         BUG_ON(!list_empty(pages));
    3899         [ #  # ]:          0 :         if (bio)
    3900                 :          0 :                 return submit_one_bio(READ, bio, 0, bio_flags);
    3901                 :            :         return 0;
    3902                 :            : }
    3903                 :            : 
    3904                 :            : /*
    3905                 :            :  * basic invalidatepage code, this waits on any locked or writeback
    3906                 :            :  * ranges corresponding to the page, and then deletes any extent state
    3907                 :            :  * records from the tree
    3908                 :            :  */
    3909                 :          0 : int extent_invalidatepage(struct extent_io_tree *tree,
    3910                 :          0 :                           struct page *page, unsigned long offset)
    3911                 :            : {
    3912                 :          0 :         struct extent_state *cached_state = NULL;
    3913                 :          0 :         u64 start = page_offset(page);
    3914                 :          0 :         u64 end = start + PAGE_CACHE_SIZE - 1;
    3915                 :          0 :         size_t blocksize = page->mapping->host->i_sb->s_blocksize;
    3916                 :            : 
    3917                 :          0 :         start += ALIGN(offset, blocksize);
    3918         [ #  # ]:          0 :         if (start > end)
    3919                 :            :                 return 0;
    3920                 :            : 
    3921                 :          0 :         lock_extent_bits(tree, start, end, 0, &cached_state);
    3922                 :            :         wait_on_page_writeback(page);
    3923                 :          0 :         clear_extent_bit(tree, start, end,
    3924                 :            :                          EXTENT_LOCKED | EXTENT_DIRTY | EXTENT_DELALLOC |
    3925                 :            :                          EXTENT_DO_ACCOUNTING,
    3926                 :            :                          1, 1, &cached_state, GFP_NOFS);
    3927                 :          0 :         return 0;
    3928                 :            : }
    3929                 :            : 
    3930                 :            : /*
    3931                 :            :  * a helper for releasepage, this tests for areas of the page that
    3932                 :            :  * are locked or under IO and drops the related state bits if it is safe
    3933                 :            :  * to drop the page.
    3934                 :            :  */
    3935                 :          0 : static int try_release_extent_state(struct extent_map_tree *map,
    3936                 :            :                                     struct extent_io_tree *tree,
    3937                 :          0 :                                     struct page *page, gfp_t mask)
    3938                 :            : {
    3939                 :          0 :         u64 start = page_offset(page);
    3940                 :          0 :         u64 end = start + PAGE_CACHE_SIZE - 1;
    3941                 :            :         int ret = 1;
    3942                 :            : 
    3943         [ #  # ]:          0 :         if (test_range_bit(tree, start, end,
    3944                 :            :                            EXTENT_IOBITS, 0, NULL))
    3945                 :            :                 ret = 0;
    3946                 :            :         else {
    3947         [ #  # ]:          0 :                 if ((mask & GFP_NOFS) == GFP_NOFS)
    3948                 :            :                         mask = GFP_NOFS;
    3949                 :            :                 /*
    3950                 :            :                  * at this point we can safely clear everything except the
    3951                 :            :                  * locked bit and the nodatasum bit
    3952                 :            :                  */
    3953                 :          0 :                 ret = clear_extent_bit(tree, start, end,
    3954                 :            :                                  ~(EXTENT_LOCKED | EXTENT_NODATASUM),
    3955                 :            :                                  0, 0, NULL, mask);
    3956                 :            : 
    3957                 :            :                 /* if clear_extent_bit failed for enomem reasons,
    3958                 :            :                  * we can't allow the release to continue.
    3959                 :            :                  */
    3960         [ #  # ]:          0 :                 if (ret < 0)
    3961                 :            :                         ret = 0;
    3962                 :            :                 else
    3963                 :            :                         ret = 1;
    3964                 :            :         }
    3965                 :          0 :         return ret;
    3966                 :            : }
    3967                 :            : 
    3968                 :            : /*
    3969                 :            :  * a helper for releasepage.  As long as there are no locked extents
    3970                 :            :  * in the range corresponding to the page, both state records and extent
    3971                 :            :  * map records are removed
    3972                 :            :  */
    3973                 :          0 : int try_release_extent_mapping(struct extent_map_tree *map,
    3974                 :          0 :                                struct extent_io_tree *tree, struct page *page,
    3975                 :            :                                gfp_t mask)
    3976                 :            : {
    3977                 :            :         struct extent_map *em;
    3978                 :          0 :         u64 start = page_offset(page);
    3979                 :          0 :         u64 end = start + PAGE_CACHE_SIZE - 1;
    3980                 :            : 
    3981 [ #  # ][ #  # ]:          0 :         if ((mask & __GFP_WAIT) &&
    3982                 :          0 :             page->mapping->host->i_size > 16 * 1024 * 1024) {
    3983                 :            :                 u64 len;
    3984         [ #  # ]:          0 :                 while (start <= end) {
    3985                 :          0 :                         len = end - start + 1;
    3986                 :          0 :                         write_lock(&map->lock);
    3987                 :          0 :                         em = lookup_extent_mapping(map, start, len);
    3988         [ #  # ]:          0 :                         if (!em) {
    3989                 :            :                                 write_unlock(&map->lock);
    3990                 :            :                                 break;
    3991                 :            :                         }
    3992 [ #  # ][ #  # ]:          0 :                         if (test_bit(EXTENT_FLAG_PINNED, &em->flags) ||
    3993                 :          0 :                             em->start != start) {
    3994                 :            :                                 write_unlock(&map->lock);
    3995                 :          0 :                                 free_extent_map(em);
    3996                 :          0 :                                 break;
    3997                 :            :                         }
    3998         [ #  # ]:          0 :                         if (!test_range_bit(tree, em->start,
    3999                 :            :                                             extent_map_end(em) - 1,
    4000                 :            :                                             EXTENT_LOCKED | EXTENT_WRITEBACK,
    4001                 :            :                                             0, NULL)) {
    4002                 :          0 :                                 remove_extent_mapping(map, em);
    4003                 :            :                                 /* once for the rb tree */
    4004                 :          0 :                                 free_extent_map(em);
    4005                 :            :                         }
    4006                 :            :                         start = extent_map_end(em);
    4007                 :            :                         write_unlock(&map->lock);
    4008                 :            : 
    4009                 :            :                         /* once for us */
    4010                 :          0 :                         free_extent_map(em);
    4011                 :            :                 }
    4012                 :            :         }
    4013                 :          0 :         return try_release_extent_state(map, tree, page, mask);
    4014                 :            : }
    4015                 :            : 
    4016                 :            : /*
    4017                 :            :  * helper function for fiemap, which doesn't want to see any holes.
    4018                 :            :  * This maps until we find something past 'last'
    4019                 :            :  */
    4020                 :          0 : static struct extent_map *get_extent_skip_holes(struct inode *inode,
    4021                 :            :                                                 u64 offset,
    4022                 :            :                                                 u64 last,
    4023                 :            :                                                 get_extent_t *get_extent)
    4024                 :            : {
    4025                 :          0 :         u64 sectorsize = BTRFS_I(inode)->root->sectorsize;
    4026                 :            :         struct extent_map *em;
    4027                 :            :         u64 len;
    4028                 :            : 
    4029         [ #  # ]:          0 :         if (offset >= last)
    4030                 :            :                 return NULL;
    4031                 :            : 
    4032                 :            :         while (1) {
    4033                 :          0 :                 len = last - offset;
    4034         [ #  # ]:          0 :                 if (len == 0)
    4035                 :            :                         break;
    4036                 :          0 :                 len = ALIGN(len, sectorsize);
    4037                 :          0 :                 em = get_extent(inode, NULL, 0, offset, len, 0);
    4038         [ #  # ]:          0 :                 if (IS_ERR_OR_NULL(em))
    4039                 :            :                         return em;
    4040                 :            : 
    4041                 :            :                 /* if this isn't a hole return it */
    4042 [ #  # ][ #  # ]:          0 :                 if (!test_bit(EXTENT_FLAG_VACANCY, &em->flags) &&
    4043                 :          0 :                     em->block_start != EXTENT_MAP_HOLE) {
    4044                 :            :                         return em;
    4045                 :            :                 }
    4046                 :            : 
    4047                 :            :                 /* this is a hole, advance to the next extent */
    4048                 :            :                 offset = extent_map_end(em);
    4049                 :          0 :                 free_extent_map(em);
    4050         [ #  # ]:          0 :                 if (offset >= last)
    4051                 :            :                         break;
    4052                 :            :         }
    4053                 :            :         return NULL;
    4054                 :            : }
    4055                 :            : 
    4056                 :          0 : static noinline int count_ext_ref(u64 inum, u64 offset, u64 root_id, void *ctx)
    4057                 :            : {
    4058                 :          0 :         unsigned long cnt = *((unsigned long *)ctx);
    4059                 :            : 
    4060                 :          0 :         cnt++;
    4061                 :          0 :         *((unsigned long *)ctx) = cnt;
    4062                 :            : 
    4063                 :            :         /* Now we're sure that the extent is shared. */
    4064         [ #  # ]:          0 :         if (cnt > 1)
    4065                 :            :                 return 1;
    4066                 :          0 :         return 0;
    4067                 :            : }
    4068                 :            : 
    4069                 :          0 : int extent_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,
    4070                 :            :                 __u64 start, __u64 len, get_extent_t *get_extent)
    4071                 :            : {
    4072                 :            :         int ret = 0;
    4073                 :            :         u64 off = start;
    4074                 :          0 :         u64 max = start + len;
    4075                 :            :         u32 flags = 0;
    4076                 :            :         u32 found_type;
    4077                 :            :         u64 last;
    4078                 :            :         u64 last_for_get_extent = 0;
    4079                 :            :         u64 disko = 0;
    4080                 :          0 :         u64 isize = i_size_read(inode);
    4081                 :            :         struct btrfs_key found_key;
    4082                 :            :         struct extent_map *em = NULL;
    4083                 :          0 :         struct extent_state *cached_state = NULL;
    4084                 :            :         struct btrfs_path *path;
    4085                 :            :         struct btrfs_file_extent_item *item;
    4086                 :            :         int end = 0;
    4087                 :            :         u64 em_start = 0;
    4088                 :            :         u64 em_len = 0;
    4089                 :            :         u64 em_end = 0;
    4090                 :            :         unsigned long emflags;
    4091                 :            : 
    4092         [ #  # ]:          0 :         if (len == 0)
    4093                 :            :                 return -EINVAL;
    4094                 :            : 
    4095                 :          0 :         path = btrfs_alloc_path();
    4096         [ #  # ]:          0 :         if (!path)
    4097                 :            :                 return -ENOMEM;
    4098                 :          0 :         path->leave_spinning = 1;
    4099                 :            : 
    4100                 :          0 :         start = ALIGN(start, BTRFS_I(inode)->root->sectorsize);
    4101                 :          0 :         len = ALIGN(len, BTRFS_I(inode)->root->sectorsize);
    4102                 :            : 
    4103                 :            :         /*
    4104                 :            :          * lookup the last file extent.  We're not using i_size here
    4105                 :            :          * because there might be preallocation past i_size
    4106                 :            :          */
    4107                 :          0 :         ret = btrfs_lookup_file_extent(NULL, BTRFS_I(inode)->root,
    4108                 :            :                                        path, btrfs_ino(inode), -1, 0);
    4109         [ #  # ]:          0 :         if (ret < 0) {
    4110                 :          0 :                 btrfs_free_path(path);
    4111                 :          0 :                 return ret;
    4112                 :            :         }
    4113         [ #  # ]:          0 :         WARN_ON(!ret);
    4114                 :          0 :         path->slots[0]--;
    4115                 :          0 :         item = btrfs_item_ptr(path->nodes[0], path->slots[0],
    4116                 :            :                               struct btrfs_file_extent_item);
    4117                 :          0 :         btrfs_item_key_to_cpu(path->nodes[0], &found_key, path->slots[0]);
    4118                 :            :         found_type = btrfs_key_type(&found_key);
    4119                 :            : 
    4120                 :            :         /* No extents, but there might be delalloc bits */
    4121 [ #  # ][ #  # ]:          0 :         if (found_key.objectid != btrfs_ino(inode) ||
    4122                 :            :             found_type != BTRFS_EXTENT_DATA_KEY) {
    4123                 :            :                 /* have to trust i_size as the end */
    4124                 :            :                 last = (u64)-1;
    4125                 :            :                 last_for_get_extent = isize;
    4126                 :            :         } else {
    4127                 :            :                 /*
    4128                 :            :                  * remember the start of the last extent.  There are a
    4129                 :            :                  * bunch of different factors that go into the length of the
    4130                 :            :                  * extent, so its much less complex to remember where it started
    4131                 :            :                  */
    4132                 :            :                 last = found_key.offset;
    4133                 :          0 :                 last_for_get_extent = last + 1;
    4134                 :            :         }
    4135                 :          0 :         btrfs_release_path(path);
    4136                 :            : 
    4137                 :            :         /*
    4138                 :            :          * we might have some extents allocated but more delalloc past those
    4139                 :            :          * extents.  so, we trust isize unless the start of the last extent is
    4140                 :            :          * beyond isize
    4141                 :            :          */
    4142         [ #  # ]:          0 :         if (last < isize) {
    4143                 :            :                 last = (u64)-1;
    4144                 :            :                 last_for_get_extent = isize;
    4145                 :            :         }
    4146                 :            : 
    4147                 :          0 :         lock_extent_bits(&BTRFS_I(inode)->io_tree, start, start + len - 1, 0,
    4148                 :            :                          &cached_state);
    4149                 :            : 
    4150                 :          0 :         em = get_extent_skip_holes(inode, start, last_for_get_extent,
    4151                 :            :                                    get_extent);
    4152         [ #  # ]:          0 :         if (!em)
    4153                 :            :                 goto out;
    4154         [ #  # ]:          0 :         if (IS_ERR(em)) {
    4155                 :            :                 ret = PTR_ERR(em);
    4156                 :          0 :                 goto out;
    4157                 :            :         }
    4158                 :            : 
    4159         [ #  # ]:          0 :         while (!end) {
    4160                 :            :                 u64 offset_in_extent = 0;
    4161                 :            : 
    4162                 :            :                 /* break if the extent we found is outside the range */
    4163 [ #  # ][ #  # ]:          0 :                 if (em->start >= max || extent_map_end(em) < off)
    4164                 :            :                         break;
    4165                 :            : 
    4166                 :            :                 /*
    4167                 :            :                  * get_extent may return an extent that starts before our
    4168                 :            :                  * requested range.  We have to make sure the ranges
    4169                 :            :                  * we return to fiemap always move forward and don't
    4170                 :            :                  * overlap, so adjust the offsets here
    4171                 :            :                  */
    4172                 :          0 :                 em_start = max(em->start, off);
    4173                 :            : 
    4174                 :            :                 /*
    4175                 :            :                  * record the offset from the start of the extent
    4176                 :            :                  * for adjusting the disk offset below.  Only do this if the
    4177                 :            :                  * extent isn't compressed since our in ram offset may be past
    4178                 :            :                  * what we have actually allocated on disk.
    4179                 :            :                  */
    4180         [ #  # ]:          0 :                 if (!test_bit(EXTENT_FLAG_COMPRESSED, &em->flags))
    4181                 :          0 :                         offset_in_extent = em_start - em->start;
    4182                 :            :                 em_end = extent_map_end(em);
    4183                 :          0 :                 em_len = em_end - em_start;
    4184                 :            :                 emflags = em->flags;
    4185                 :            :                 disko = 0;
    4186                 :            :                 flags = 0;
    4187                 :            : 
    4188                 :            :                 /*
    4189                 :            :                  * bump off for our next call to get_extent
    4190                 :            :                  */
    4191                 :            :                 off = extent_map_end(em);
    4192         [ #  # ]:          0 :                 if (off >= max)
    4193                 :            :                         end = 1;
    4194                 :            : 
    4195         [ #  # ]:          0 :                 if (em->block_start == EXTENT_MAP_LAST_BYTE) {
    4196                 :            :                         end = 1;
    4197                 :            :                         flags |= FIEMAP_EXTENT_LAST;
    4198         [ #  # ]:          0 :                 } else if (em->block_start == EXTENT_MAP_INLINE) {
    4199                 :            :                         flags |= (FIEMAP_EXTENT_DATA_INLINE |
    4200                 :            :                                   FIEMAP_EXTENT_NOT_ALIGNED);
    4201         [ #  # ]:          0 :                 } else if (em->block_start == EXTENT_MAP_DELALLOC) {
    4202                 :            :                         flags |= (FIEMAP_EXTENT_DELALLOC |
    4203                 :            :                                   FIEMAP_EXTENT_UNKNOWN);
    4204                 :            :                 } else {
    4205                 :          0 :                         unsigned long ref_cnt = 0;
    4206                 :            : 
    4207                 :          0 :                         disko = em->block_start + offset_in_extent;
    4208                 :            : 
    4209                 :            :                         /*
    4210                 :            :                          * As btrfs supports shared space, this information
    4211                 :            :                          * can be exported to userspace tools via
    4212                 :            :                          * flag FIEMAP_EXTENT_SHARED.
    4213                 :            :                          */
    4214                 :          0 :                         ret = iterate_inodes_from_logical(
    4215                 :            :                                         em->block_start,
    4216                 :          0 :                                         BTRFS_I(inode)->root->fs_info,
    4217                 :            :                                         path, count_ext_ref, &ref_cnt);
    4218         [ #  # ]:          0 :                         if (ret < 0 && ret != -ENOENT)
    4219                 :            :                                 goto out_free;
    4220                 :            : 
    4221         [ #  # ]:          0 :                         if (ref_cnt > 1)
    4222                 :            :                                 flags |= FIEMAP_EXTENT_SHARED;
    4223                 :            :                 }
    4224         [ #  # ]:          0 :                 if (test_bit(EXTENT_FLAG_COMPRESSED, &em->flags))
    4225                 :          0 :                         flags |= FIEMAP_EXTENT_ENCODED;
    4226                 :            : 
    4227                 :          0 :                 free_extent_map(em);
    4228                 :            :                 em = NULL;
    4229 [ #  # ][ #  # ]:          0 :                 if ((em_start >= last) || em_len == (u64)-1 ||
    4230                 :          0 :                    (last == (u64)-1 && isize <= em_end)) {
    4231                 :          0 :                         flags |= FIEMAP_EXTENT_LAST;
    4232                 :            :                         end = 1;
    4233                 :            :                 }
    4234                 :            : 
    4235                 :            :                 /* now scan forward to see if this is really the last extent. */
    4236                 :          0 :                 em = get_extent_skip_holes(inode, off, last_for_get_extent,
    4237                 :            :                                            get_extent);
    4238         [ #  # ]:          0 :                 if (IS_ERR(em)) {
    4239                 :            :                         ret = PTR_ERR(em);
    4240                 :          0 :                         goto out;
    4241                 :            :                 }
    4242         [ #  # ]:          0 :                 if (!em) {
    4243                 :          0 :                         flags |= FIEMAP_EXTENT_LAST;
    4244                 :            :                         end = 1;
    4245                 :            :                 }
    4246                 :          0 :                 ret = fiemap_fill_next_extent(fieinfo, em_start, disko,
    4247                 :            :                                               em_len, flags);
    4248         [ #  # ]:          0 :                 if (ret)
    4249                 :            :                         goto out_free;
    4250                 :            :         }
    4251                 :            : out_free:
    4252                 :          0 :         free_extent_map(em);
    4253                 :            : out:
    4254                 :          0 :         btrfs_free_path(path);
    4255                 :            :         unlock_extent_cached(&BTRFS_I(inode)->io_tree, start, start + len - 1,
    4256                 :            :                              &cached_state, GFP_NOFS);
    4257                 :          0 :         return ret;
    4258                 :            : }
    4259                 :            : 
    4260                 :          0 : static void __free_extent_buffer(struct extent_buffer *eb)
    4261                 :            : {
    4262                 :            :         btrfs_leak_debug_del(&eb->leak_list);
    4263                 :          0 :         kmem_cache_free(extent_buffer_cache, eb);
    4264                 :          0 : }
    4265                 :            : 
    4266                 :            : static int extent_buffer_under_io(struct extent_buffer *eb)
    4267                 :            : {
    4268 [ #  # ][ #  # ]:          0 :         return (atomic_read(&eb->io_pages) ||
         [ #  # ][ #  # ]
    4269 [ #  # ][ #  # ]:          0 :                 test_bit(EXTENT_BUFFER_WRITEBACK, &eb->bflags) ||
         [ #  # ][ #  # ]
         [ #  # ][ #  # ]
         [ #  # ][ #  # ]
    4270                 :            :                 test_bit(EXTENT_BUFFER_DIRTY, &eb->bflags));
    4271                 :            : }
    4272                 :            : 
    4273                 :            : /*
    4274                 :            :  * Helper for releasing extent buffer page.
    4275                 :            :  */
    4276                 :          0 : static void btrfs_release_extent_buffer_page(struct extent_buffer *eb,
    4277                 :            :                                                 unsigned long start_idx)
    4278                 :            : {
    4279                 :            :         unsigned long index;
    4280                 :            :         unsigned long num_pages;
    4281                 :            :         struct page *page;
    4282                 :          0 :         int mapped = !test_bit(EXTENT_BUFFER_DUMMY, &eb->bflags);
    4283                 :            : 
    4284         [ #  # ]:          0 :         BUG_ON(extent_buffer_under_io(eb));
    4285                 :            : 
    4286                 :          0 :         num_pages = num_extent_pages(eb->start, eb->len);
    4287                 :          0 :         index = start_idx + num_pages;
    4288         [ #  # ]:          0 :         if (start_idx >= index)
    4289                 :          0 :                 return;
    4290                 :            : 
    4291                 :            :         do {
    4292                 :          0 :                 index--;
    4293                 :            :                 page = extent_buffer_page(eb, index);
    4294         [ #  # ]:          0 :                 if (page && mapped) {
    4295                 :          0 :                         spin_lock(&page->mapping->private_lock);
    4296                 :            :                         /*
    4297                 :            :                          * We do this since we'll remove the pages after we've
    4298                 :            :                          * removed the eb from the radix tree, so we could race
    4299                 :            :                          * and have this page now attached to the new eb.  So
    4300                 :            :                          * only clear page_private if it's still connected to
    4301                 :            :                          * this eb.
    4302                 :            :                          */
    4303 [ #  # ][ #  # ]:          0 :                         if (PagePrivate(page) &&
    4304                 :          0 :                             page->private == (unsigned long)eb) {
    4305         [ #  # ]:          0 :                                 BUG_ON(test_bit(EXTENT_BUFFER_DIRTY, &eb->bflags));
    4306         [ #  # ]:          0 :                                 BUG_ON(PageDirty(page));
    4307         [ #  # ]:          0 :                                 BUG_ON(PageWriteback(page));
    4308                 :            :                                 /*
    4309                 :            :                                  * We need to make sure we haven't be attached
    4310                 :            :                                  * to a new eb.
    4311                 :            :                                  */
    4312                 :            :                                 ClearPagePrivate(page);
    4313                 :          0 :                                 set_page_private(page, 0);
    4314                 :            :                                 /* One for the page private */
    4315                 :          0 :                                 page_cache_release(page);
    4316                 :            :                         }
    4317                 :          0 :                         spin_unlock(&page->mapping->private_lock);
    4318                 :            : 
    4319                 :            :                 }
    4320         [ #  # ]:          0 :                 if (page) {
    4321                 :            :                         /* One for when we alloced the page */
    4322                 :          0 :                         page_cache_release(page);
    4323                 :            :                 }
    4324         [ #  # ]:          0 :         } while (index != start_idx);
    4325                 :            : }
    4326                 :            : 
    4327                 :            : /*
    4328                 :            :  * Helper for releasing the extent buffer.
    4329                 :            :  */
    4330                 :            : static inline void btrfs_release_extent_buffer(struct extent_buffer *eb)
    4331                 :            : {
    4332                 :          0 :         btrfs_release_extent_buffer_page(eb, 0);
    4333                 :          0 :         __free_extent_buffer(eb);
    4334                 :            : }
    4335                 :            : 
    4336                 :          0 : static struct extent_buffer *__alloc_extent_buffer(struct extent_io_tree *tree,
    4337                 :            :                                                    u64 start,
    4338                 :            :                                                    unsigned long len,
    4339                 :            :                                                    gfp_t mask)
    4340                 :            : {
    4341                 :            :         struct extent_buffer *eb = NULL;
    4342                 :            : 
    4343                 :          0 :         eb = kmem_cache_zalloc(extent_buffer_cache, mask);
    4344         [ #  # ]:          0 :         if (eb == NULL)
    4345                 :            :                 return NULL;
    4346                 :          0 :         eb->start = start;
    4347                 :          0 :         eb->len = len;
    4348                 :          0 :         eb->tree = tree;
    4349                 :          0 :         eb->bflags = 0;
    4350                 :          0 :         rwlock_init(&eb->lock);
    4351                 :          0 :         atomic_set(&eb->write_locks, 0);
    4352                 :          0 :         atomic_set(&eb->read_locks, 0);
    4353                 :          0 :         atomic_set(&eb->blocking_readers, 0);
    4354                 :          0 :         atomic_set(&eb->blocking_writers, 0);
    4355                 :          0 :         atomic_set(&eb->spinning_readers, 0);
    4356                 :          0 :         atomic_set(&eb->spinning_writers, 0);
    4357                 :          0 :         eb->lock_nested = 0;
    4358                 :          0 :         init_waitqueue_head(&eb->write_lock_wq);
    4359                 :          0 :         init_waitqueue_head(&eb->read_lock_wq);
    4360                 :            : 
    4361                 :            :         btrfs_leak_debug_add(&eb->leak_list, &buffers);
    4362                 :            : 
    4363                 :          0 :         spin_lock_init(&eb->refs_lock);
    4364                 :          0 :         atomic_set(&eb->refs, 1);
    4365                 :          0 :         atomic_set(&eb->io_pages, 0);
    4366                 :            : 
    4367                 :            :         /*
    4368                 :            :          * Sanity checks, currently the maximum is 64k covered by 16x 4k pages
    4369                 :            :          */
    4370                 :            :         BUILD_BUG_ON(BTRFS_MAX_METADATA_BLOCKSIZE
    4371                 :            :                 > MAX_INLINE_EXTENT_BUFFER_SIZE);
    4372         [ #  # ]:          0 :         BUG_ON(len > MAX_INLINE_EXTENT_BUFFER_SIZE);
    4373                 :            : 
    4374                 :            :         return eb;
    4375                 :            : }
    4376                 :            : 
    4377                 :          0 : struct extent_buffer *btrfs_clone_extent_buffer(struct extent_buffer *src)
    4378                 :            : {
    4379                 :            :         unsigned long i;
    4380                 :            :         struct page *p;
    4381                 :            :         struct extent_buffer *new;
    4382                 :          0 :         unsigned long num_pages = num_extent_pages(src->start, src->len);
    4383                 :            : 
    4384                 :          0 :         new = __alloc_extent_buffer(NULL, src->start, src->len, GFP_NOFS);
    4385         [ #  # ]:          0 :         if (new == NULL)
    4386                 :            :                 return NULL;
    4387                 :            : 
    4388         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    4389                 :            :                 p = alloc_page(GFP_NOFS);
    4390         [ #  # ]:          0 :                 if (!p) {
    4391                 :            :                         btrfs_release_extent_buffer(new);
    4392                 :          0 :                         return NULL;
    4393                 :            :                 }
    4394                 :          0 :                 attach_extent_buffer_page(new, p);
    4395         [ #  # ]:          0 :                 WARN_ON(PageDirty(p));
    4396                 :            :                 SetPageUptodate(p);
    4397                 :          0 :                 new->pages[i] = p;
    4398                 :            :         }
    4399                 :            : 
    4400                 :          0 :         copy_extent_buffer(new, src, 0, 0, src->len);
    4401                 :          0 :         set_bit(EXTENT_BUFFER_UPTODATE, &new->bflags);
    4402                 :          0 :         set_bit(EXTENT_BUFFER_DUMMY, &new->bflags);
    4403                 :            : 
    4404                 :          0 :         return new;
    4405                 :            : }
    4406                 :            : 
    4407                 :          0 : struct extent_buffer *alloc_dummy_extent_buffer(u64 start, unsigned long len)
    4408                 :            : {
    4409                 :          0 :         struct extent_buffer *eb;
    4410                 :          0 :         unsigned long num_pages = num_extent_pages(0, len);
    4411                 :            :         unsigned long i;
    4412                 :            : 
    4413                 :          0 :         eb = __alloc_extent_buffer(NULL, start, len, GFP_NOFS);
    4414         [ #  # ]:          0 :         if (!eb)
    4415                 :            :                 return NULL;
    4416                 :            : 
    4417         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    4418                 :          0 :                 eb->pages[i] = alloc_page(GFP_NOFS);
    4419         [ #  # ]:          0 :                 if (!eb->pages[i])
    4420                 :            :                         goto err;
    4421                 :            :         }
    4422                 :          0 :         set_extent_buffer_uptodate(eb);
    4423                 :            :         btrfs_set_header_nritems(eb, 0);
    4424                 :          0 :         set_bit(EXTENT_BUFFER_DUMMY, &eb->bflags);
    4425                 :            : 
    4426                 :          0 :         return eb;
    4427                 :            : err:
    4428         [ #  # ]:          0 :         for (; i > 0; i--)
    4429                 :          0 :                 __free_page(eb->pages[i - 1]);
    4430                 :            :         __free_extent_buffer(eb);
    4431                 :          0 :         return NULL;
    4432                 :            : }
    4433                 :            : 
    4434                 :          0 : static void check_buffer_tree_ref(struct extent_buffer *eb)
    4435                 :            : {
    4436                 :            :         int refs;
    4437                 :            :         /* the ref bit is tricky.  We have to make sure it is set
    4438                 :            :          * if we have the buffer dirty.   Otherwise the
    4439                 :            :          * code to free a buffer can end up dropping a dirty
    4440                 :            :          * page
    4441                 :            :          *
    4442                 :            :          * Once the ref bit is set, it won't go away while the
    4443                 :            :          * buffer is dirty or in writeback, and it also won't
    4444                 :            :          * go away while we have the reference count on the
    4445                 :            :          * eb bumped.
    4446                 :            :          *
    4447                 :            :          * We can't just set the ref bit without bumping the
    4448                 :            :          * ref on the eb because free_extent_buffer might
    4449                 :            :          * see the ref bit and try to clear it.  If this happens
    4450                 :            :          * free_extent_buffer might end up dropping our original
    4451                 :            :          * ref by mistake and freeing the page before we are able
    4452                 :            :          * to add one more ref.
    4453                 :            :          *
    4454                 :            :          * So bump the ref count first, then set the bit.  If someone
    4455                 :            :          * beat us to it, drop the ref we added.
    4456                 :            :          */
    4457                 :          0 :         refs = atomic_read(&eb->refs);
    4458 [ #  # ][ #  # ]:          0 :         if (refs >= 2 && test_bit(EXTENT_BUFFER_TREE_REF, &eb->bflags))
    4459                 :          0 :                 return;
    4460                 :            : 
    4461                 :            :         spin_lock(&eb->refs_lock);
    4462         [ #  # ]:          0 :         if (!test_and_set_bit(EXTENT_BUFFER_TREE_REF, &eb->bflags))
    4463                 :          0 :                 atomic_inc(&eb->refs);
    4464                 :            :         spin_unlock(&eb->refs_lock);
    4465                 :            : }
    4466                 :            : 
    4467                 :          0 : static void mark_extent_buffer_accessed(struct extent_buffer *eb)
    4468                 :            : {
    4469                 :            :         unsigned long num_pages, i;
    4470                 :            : 
    4471                 :          0 :         check_buffer_tree_ref(eb);
    4472                 :            : 
    4473                 :          0 :         num_pages = num_extent_pages(eb->start, eb->len);
    4474         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    4475                 :            :                 struct page *p = extent_buffer_page(eb, i);
    4476                 :          0 :                 mark_page_accessed(p);
    4477                 :            :         }
    4478                 :          0 : }
    4479                 :            : 
    4480                 :          0 : struct extent_buffer *find_extent_buffer(struct extent_io_tree *tree,
    4481                 :            :                                                         u64 start)
    4482                 :            : {
    4483                 :            :         struct extent_buffer *eb;
    4484                 :            : 
    4485                 :            :         rcu_read_lock();
    4486                 :          0 :         eb = radix_tree_lookup(&tree->buffer, start >> PAGE_CACHE_SHIFT);
    4487 [ #  # ][ #  # ]:          0 :         if (eb && atomic_inc_not_zero(&eb->refs)) {
    4488                 :            :                 rcu_read_unlock();
    4489                 :          0 :                 mark_extent_buffer_accessed(eb);
    4490                 :          0 :                 return eb;
    4491                 :            :         }
    4492                 :            :         rcu_read_unlock();
    4493                 :            : 
    4494                 :          0 :         return NULL;
    4495                 :            : }
    4496                 :            : 
    4497                 :          0 : struct extent_buffer *alloc_extent_buffer(struct extent_io_tree *tree,
    4498                 :            :                                           u64 start, unsigned long len)
    4499                 :            : {
    4500                 :          0 :         unsigned long num_pages = num_extent_pages(start, len);
    4501                 :            :         unsigned long i;
    4502                 :            :         unsigned long index = start >> PAGE_CACHE_SHIFT;
    4503                 :            :         struct extent_buffer *eb;
    4504                 :            :         struct extent_buffer *exists = NULL;
    4505                 :            :         struct page *p;
    4506                 :          0 :         struct address_space *mapping = tree->mapping;
    4507                 :            :         int uptodate = 1;
    4508                 :            :         int ret;
    4509                 :            : 
    4510                 :            : 
    4511                 :          0 :         eb = find_extent_buffer(tree, start);
    4512         [ #  # ]:          0 :         if (eb)
    4513                 :            :                 return eb;
    4514                 :            : 
    4515                 :          0 :         eb = __alloc_extent_buffer(tree, start, len, GFP_NOFS);
    4516         [ #  # ]:          0 :         if (!eb)
    4517                 :            :                 return NULL;
    4518                 :            : 
    4519         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++, index++) {
    4520                 :          0 :                 p = find_or_create_page(mapping, index, GFP_NOFS);
    4521         [ #  # ]:          0 :                 if (!p)
    4522                 :            :                         goto free_eb;
    4523                 :            : 
    4524                 :            :                 spin_lock(&mapping->private_lock);
    4525         [ #  # ]:          0 :                 if (PagePrivate(p)) {
    4526                 :            :                         /*
    4527                 :            :                          * We could have already allocated an eb for this page
    4528                 :            :                          * and attached one so lets see if we can get a ref on
    4529                 :            :                          * the existing eb, and if we can we know it's good and
    4530                 :            :                          * we can just return that one, else we know we can just
    4531                 :            :                          * overwrite page->private.
    4532                 :            :                          */
    4533                 :          0 :                         exists = (struct extent_buffer *)p->private;
    4534         [ #  # ]:          0 :                         if (atomic_inc_not_zero(&exists->refs)) {
    4535                 :            :                                 spin_unlock(&mapping->private_lock);
    4536                 :          0 :                                 unlock_page(p);
    4537                 :          0 :                                 page_cache_release(p);
    4538                 :          0 :                                 mark_extent_buffer_accessed(exists);
    4539                 :          0 :                                 goto free_eb;
    4540                 :            :                         }
    4541                 :            : 
    4542                 :            :                         /*
    4543                 :            :                          * Do this so attach doesn't complain and we need to
    4544                 :            :                          * drop the ref the old guy had.
    4545                 :            :                          */
    4546                 :            :                         ClearPagePrivate(p);
    4547         [ #  # ]:          0 :                         WARN_ON(PageDirty(p));
    4548                 :          0 :                         page_cache_release(p);
    4549                 :            :                 }
    4550                 :          0 :                 attach_extent_buffer_page(eb, p);
    4551                 :            :                 spin_unlock(&mapping->private_lock);
    4552         [ #  # ]:          0 :                 WARN_ON(PageDirty(p));
    4553                 :          0 :                 mark_page_accessed(p);
    4554                 :          0 :                 eb->pages[i] = p;
    4555         [ #  # ]:          0 :                 if (!PageUptodate(p))
    4556                 :            :                         uptodate = 0;
    4557                 :            : 
    4558                 :            :                 /*
    4559                 :            :                  * see below about how we avoid a nasty race with release page
    4560                 :            :                  * and why we unlock later
    4561                 :            :                  */
    4562                 :            :         }
    4563         [ #  # ]:          0 :         if (uptodate)
    4564                 :          0 :                 set_bit(EXTENT_BUFFER_UPTODATE, &eb->bflags);
    4565                 :            : again:
    4566                 :          0 :         ret = radix_tree_preload(GFP_NOFS & ~__GFP_HIGHMEM);
    4567         [ #  # ]:          0 :         if (ret)
    4568                 :            :                 goto free_eb;
    4569                 :            : 
    4570                 :            :         spin_lock(&tree->buffer_lock);
    4571                 :          0 :         ret = radix_tree_insert(&tree->buffer, start >> PAGE_CACHE_SHIFT, eb);
    4572                 :            :         spin_unlock(&tree->buffer_lock);
    4573                 :            :         radix_tree_preload_end();
    4574         [ #  # ]:          0 :         if (ret == -EEXIST) {
    4575                 :          0 :                 exists = find_extent_buffer(tree, start);
    4576         [ #  # ]:          0 :                 if (exists)
    4577                 :            :                         goto free_eb;
    4578                 :            :                 else
    4579                 :            :                         goto again;
    4580                 :            :         }
    4581                 :            :         /* add one reference for the tree */
    4582                 :          0 :         check_buffer_tree_ref(eb);
    4583                 :            : 
    4584                 :            :         /*
    4585                 :            :          * there is a race where release page may have
    4586                 :            :          * tried to find this extent buffer in the radix
    4587                 :            :          * but failed.  It will tell the VM it is safe to
    4588                 :            :          * reclaim the, and it will clear the page private bit.
    4589                 :            :          * We must make sure to set the page private bit properly
    4590                 :            :          * after the extent buffer is in the radix tree so
    4591                 :            :          * it doesn't get lost
    4592                 :            :          */
    4593                 :          0 :         SetPageChecked(eb->pages[0]);
    4594         [ #  # ]:          0 :         for (i = 1; i < num_pages; i++) {
    4595                 :            :                 p = extent_buffer_page(eb, i);
    4596                 :            :                 ClearPageChecked(p);
    4597                 :          0 :                 unlock_page(p);
    4598                 :            :         }
    4599                 :          0 :         unlock_page(eb->pages[0]);
    4600                 :          0 :         return eb;
    4601                 :            : 
    4602                 :            : free_eb:
    4603         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    4604         [ #  # ]:          0 :                 if (eb->pages[i])
    4605                 :          0 :                         unlock_page(eb->pages[i]);
    4606                 :            :         }
    4607                 :            : 
    4608         [ #  # ]:          0 :         WARN_ON(!atomic_dec_and_test(&eb->refs));
    4609                 :            :         btrfs_release_extent_buffer(eb);
    4610                 :          0 :         return exists;
    4611                 :            : }
    4612                 :            : 
    4613                 :          0 : static inline void btrfs_release_extent_buffer_rcu(struct rcu_head *head)
    4614                 :            : {
    4615                 :          0 :         struct extent_buffer *eb =
    4616                 :            :                         container_of(head, struct extent_buffer, rcu_head);
    4617                 :            : 
    4618                 :          0 :         __free_extent_buffer(eb);
    4619                 :          0 : }
    4620                 :            : 
    4621                 :            : /* Expects to have eb->eb_lock already held */
    4622                 :          0 : static int release_extent_buffer(struct extent_buffer *eb)
    4623                 :            : {
    4624         [ #  # ]:          0 :         WARN_ON(atomic_read(&eb->refs) == 0);
    4625         [ #  # ]:          0 :         if (atomic_dec_and_test(&eb->refs)) {
    4626         [ #  # ]:          0 :                 if (test_bit(EXTENT_BUFFER_DUMMY, &eb->bflags)) {
    4627                 :            :                         spin_unlock(&eb->refs_lock);
    4628                 :            :                 } else {
    4629                 :          0 :                         struct extent_io_tree *tree = eb->tree;
    4630                 :            : 
    4631                 :            :                         spin_unlock(&eb->refs_lock);
    4632                 :            : 
    4633                 :            :                         spin_lock(&tree->buffer_lock);
    4634                 :          0 :                         radix_tree_delete(&tree->buffer,
    4635                 :          0 :                                           eb->start >> PAGE_CACHE_SHIFT);
    4636                 :            :                         spin_unlock(&tree->buffer_lock);
    4637                 :            :                 }
    4638                 :            : 
    4639                 :            :                 /* Should be safe to release our pages at this point */
    4640                 :          0 :                 btrfs_release_extent_buffer_page(eb, 0);
    4641                 :          0 :                 call_rcu(&eb->rcu_head, btrfs_release_extent_buffer_rcu);
    4642                 :          0 :                 return 1;
    4643                 :            :         }
    4644                 :            :         spin_unlock(&eb->refs_lock);
    4645                 :            : 
    4646                 :          0 :         return 0;
    4647                 :            : }
    4648                 :            : 
    4649                 :          0 : void free_extent_buffer(struct extent_buffer *eb)
    4650                 :            : {
    4651                 :            :         int refs;
    4652                 :            :         int old;
    4653         [ #  # ]:          0 :         if (!eb)
    4654                 :            :                 return;
    4655                 :            : 
    4656                 :            :         while (1) {
    4657                 :          0 :                 refs = atomic_read(&eb->refs);
    4658         [ #  # ]:          0 :                 if (refs <= 3)
    4659                 :            :                         break;
    4660                 :          0 :                 old = atomic_cmpxchg(&eb->refs, refs, refs - 1);
    4661         [ #  # ]:          0 :                 if (old == refs)
    4662                 :            :                         return;
    4663                 :            :         }
    4664                 :            : 
    4665                 :            :         spin_lock(&eb->refs_lock);
    4666 [ #  # ][ #  # ]:          0 :         if (atomic_read(&eb->refs) == 2 &&
    4667                 :            :             test_bit(EXTENT_BUFFER_DUMMY, &eb->bflags))
    4668                 :          0 :                 atomic_dec(&eb->refs);
    4669                 :            : 
    4670 [ #  # ][ #  # ]:          0 :         if (atomic_read(&eb->refs) == 2 &&
    4671         [ #  # ]:          0 :             test_bit(EXTENT_BUFFER_STALE, &eb->bflags) &&
    4672         [ #  # ]:          0 :             !extent_buffer_under_io(eb) &&
    4673                 :          0 :             test_and_clear_bit(EXTENT_BUFFER_TREE_REF, &eb->bflags))
    4674                 :          0 :                 atomic_dec(&eb->refs);
    4675                 :            : 
    4676                 :            :         /*
    4677                 :            :          * I know this is terrible, but it's temporary until we stop tracking
    4678                 :            :          * the uptodate bits and such for the extent buffers.
    4679                 :            :          */
    4680                 :          0 :         release_extent_buffer(eb);
    4681                 :            : }
    4682                 :            : 
    4683                 :          0 : void free_extent_buffer_stale(struct extent_buffer *eb)
    4684                 :            : {
    4685         [ #  # ]:          0 :         if (!eb)
    4686                 :          0 :                 return;
    4687                 :            : 
    4688                 :            :         spin_lock(&eb->refs_lock);
    4689                 :          0 :         set_bit(EXTENT_BUFFER_STALE, &eb->bflags);
    4690                 :            : 
    4691         [ #  # ]:          0 :         if (atomic_read(&eb->refs) == 2 && !extent_buffer_under_io(eb) &&
           [ #  #  #  # ]
    4692                 :          0 :             test_and_clear_bit(EXTENT_BUFFER_TREE_REF, &eb->bflags))
    4693                 :          0 :                 atomic_dec(&eb->refs);
    4694                 :          0 :         release_extent_buffer(eb);
    4695                 :            : }
    4696                 :            : 
    4697                 :          0 : void clear_extent_buffer_dirty(struct extent_buffer *eb)
    4698                 :            : {
    4699                 :            :         unsigned long i;
    4700                 :            :         unsigned long num_pages;
    4701                 :            :         struct page *page;
    4702                 :            : 
    4703                 :          0 :         num_pages = num_extent_pages(eb->start, eb->len);
    4704                 :            : 
    4705         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    4706                 :            :                 page = extent_buffer_page(eb, i);
    4707         [ #  # ]:          0 :                 if (!PageDirty(page))
    4708                 :          0 :                         continue;
    4709                 :            : 
    4710                 :            :                 lock_page(page);
    4711         [ #  # ]:          0 :                 WARN_ON(!PagePrivate(page));
    4712                 :            : 
    4713                 :          0 :                 clear_page_dirty_for_io(page);
    4714                 :          0 :                 spin_lock_irq(&page->mapping->tree_lock);
    4715         [ #  # ]:          0 :                 if (!PageDirty(page)) {
    4716                 :          0 :                         radix_tree_tag_clear(&page->mapping->page_tree,
    4717                 :            :                                                 page_index(page),
    4718                 :            :                                                 PAGECACHE_TAG_DIRTY);
    4719                 :            :                 }
    4720                 :          0 :                 spin_unlock_irq(&page->mapping->tree_lock);
    4721                 :            :                 ClearPageError(page);
    4722                 :          0 :                 unlock_page(page);
    4723                 :            :         }
    4724         [ #  # ]:          0 :         WARN_ON(atomic_read(&eb->refs) == 0);
    4725                 :          0 : }
    4726                 :            : 
    4727                 :          0 : int set_extent_buffer_dirty(struct extent_buffer *eb)
    4728                 :            : {
    4729                 :            :         unsigned long i;
    4730                 :            :         unsigned long num_pages;
    4731                 :            :         int was_dirty = 0;
    4732                 :            : 
    4733                 :          0 :         check_buffer_tree_ref(eb);
    4734                 :            : 
    4735                 :          0 :         was_dirty = test_and_set_bit(EXTENT_BUFFER_DIRTY, &eb->bflags);
    4736                 :            : 
    4737                 :          0 :         num_pages = num_extent_pages(eb->start, eb->len);
    4738         [ #  # ]:          0 :         WARN_ON(atomic_read(&eb->refs) == 0);
    4739         [ #  # ]:          0 :         WARN_ON(!test_bit(EXTENT_BUFFER_TREE_REF, &eb->bflags));
    4740                 :            : 
    4741         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++)
    4742                 :          0 :                 set_page_dirty(extent_buffer_page(eb, i));
    4743                 :          0 :         return was_dirty;
    4744                 :            : }
    4745                 :            : 
    4746                 :          0 : int clear_extent_buffer_uptodate(struct extent_buffer *eb)
    4747                 :            : {
    4748                 :            :         unsigned long i;
    4749                 :            :         struct page *page;
    4750                 :            :         unsigned long num_pages;
    4751                 :            : 
    4752                 :          0 :         clear_bit(EXTENT_BUFFER_UPTODATE, &eb->bflags);
    4753                 :          0 :         num_pages = num_extent_pages(eb->start, eb->len);
    4754         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    4755                 :            :                 page = extent_buffer_page(eb, i);
    4756         [ #  # ]:          0 :                 if (page)
    4757                 :            :                         ClearPageUptodate(page);
    4758                 :            :         }
    4759                 :          0 :         return 0;
    4760                 :            : }
    4761                 :            : 
    4762                 :          0 : int set_extent_buffer_uptodate(struct extent_buffer *eb)
    4763                 :            : {
    4764                 :            :         unsigned long i;
    4765                 :            :         struct page *page;
    4766                 :            :         unsigned long num_pages;
    4767                 :            : 
    4768                 :          0 :         set_bit(EXTENT_BUFFER_UPTODATE, &eb->bflags);
    4769                 :          0 :         num_pages = num_extent_pages(eb->start, eb->len);
    4770         [ #  # ]:          0 :         for (i = 0; i < num_pages; i++) {
    4771                 :            :                 page = extent_buffer_page(eb, i);
    4772                 :            :                 SetPageUptodate(page);
    4773                 :            :         }
    4774                 :          0 :         return 0;
    4775                 :            : }
    4776                 :            : 
    4777                 :          0 : int extent_buffer_uptodate(struct extent_buffer *eb)
    4778                 :            : {
    4779                 :          0 :         return test_bit(EXTENT_BUFFER_UPTODATE, &eb->bflags);
    4780                 :            : }
    4781                 :            : 
    4782                 :          0 : int read_extent_buffer_pages(struct extent_io_tree *tree,
    4783                 :            :                              struct extent_buffer *eb, u64 start, int wait,
    4784                 :            :                              get_extent_t *get_extent, int mirror_num)
    4785                 :            : {
    4786                 :            :         unsigned long i;
    4787                 :            :         unsigned long start_i;
    4788                 :            :         struct page *page;
    4789                 :            :         int err;
    4790                 :            :         int ret = 0;
    4791                 :            :         int locked_pages = 0;
    4792                 :            :         int all_uptodate = 1;
    4793                 :            :         unsigned long num_pages;
    4794                 :            :         unsigned long num_reads = 0;
    4795                 :          0 :         struct bio *bio = NULL;
    4796                 :          0 :         unsigned long bio_flags = 0;
    4797                 :            : 
    4798         [ #  # ]:          0 :         if (test_bit(EXTENT_BUFFER_UPTODATE, &eb->bflags))
    4799                 :            :                 return 0;
    4800                 :            : 
    4801         [ #  # ]:          0 :         if (start) {
    4802         [ #  # ]:          0 :                 WARN_ON(start < eb->start);
    4803                 :          0 :                 start_i = (start >> PAGE_CACHE_SHIFT) -
    4804                 :          0 :                         (eb->start >> PAGE_CACHE_SHIFT);
    4805                 :            :         } else {
    4806                 :            :                 start_i = 0;
    4807                 :            :         }
    4808                 :            : 
    4809                 :          0 :         num_pages = num_extent_pages(eb->start, eb->len);
    4810         [ #  # ]:          0 :         for (i = start_i; i < num_pages; i++) {
    4811                 :            :                 page = extent_buffer_page(eb, i);
    4812         [ #  # ]:          0 :                 if (wait == WAIT_NONE) {
    4813         [ #  # ]:          0 :                         if (!trylock_page(page))
    4814                 :            :                                 goto unlock_exit;
    4815                 :            :                 } else {
    4816                 :            :                         lock_page(page);
    4817                 :            :                 }
    4818                 :          0 :                 locked_pages++;
    4819         [ #  # ]:          0 :                 if (!PageUptodate(page)) {
    4820                 :          0 :                         num_reads++;
    4821                 :            :                         all_uptodate = 0;
    4822                 :            :                 }
    4823                 :            :         }
    4824         [ #  # ]:          0 :         if (all_uptodate) {
    4825         [ #  # ]:          0 :                 if (start_i == 0)
    4826                 :          0 :                         set_bit(EXTENT_BUFFER_UPTODATE, &eb->bflags);
    4827                 :            :                 goto unlock_exit;
    4828                 :            :         }
    4829                 :            : 
    4830                 :          0 :         clear_bit(EXTENT_BUFFER_IOERR, &eb->bflags);
    4831                 :          0 :         eb->read_mirror = 0;
    4832                 :          0 :         atomic_set(&eb->io_pages, num_reads);
    4833         [ #  # ]:          0 :         for (i = start_i; i < num_pages; i++) {
    4834                 :            :                 page = extent_buffer_page(eb, i);
    4835         [ #  # ]:          0 :                 if (!PageUptodate(page)) {
    4836                 :            :                         ClearPageError(page);
    4837                 :          0 :                         err = __extent_read_full_page(tree, page,
    4838                 :            :                                                       get_extent, &bio,
    4839                 :            :                                                       mirror_num, &bio_flags,
    4840                 :            :                                                       READ | REQ_META);
    4841         [ #  # ]:          0 :                         if (err)
    4842                 :            :                                 ret = err;
    4843                 :            :                 } else {
    4844                 :          0 :                         unlock_page(page);
    4845                 :            :                 }
    4846                 :            :         }
    4847                 :            : 
    4848         [ #  # ]:          0 :         if (bio) {
    4849                 :          0 :                 err = submit_one_bio(READ | REQ_META, bio, mirror_num,
    4850                 :            :                                      bio_flags);
    4851         [ #  # ]:          0 :                 if (err)
    4852                 :            :                         return err;
    4853                 :            :         }
    4854                 :            : 
    4855         [ #  # ]:          0 :         if (ret || wait != WAIT_COMPLETE)
    4856                 :            :                 return ret;
    4857                 :            : 
    4858         [ #  # ]:          0 :         for (i = start_i; i < num_pages; i++) {
    4859                 :            :                 page = extent_buffer_page(eb, i);
    4860                 :            :                 wait_on_page_locked(page);
    4861         [ #  # ]:          0 :                 if (!PageUptodate(page))
    4862                 :            :                         ret = -EIO;
    4863                 :            :         }
    4864                 :            : 
    4865                 :            :         return ret;
    4866                 :            : 
    4867                 :            : unlock_exit:
    4868                 :            :         i = start_i;
    4869         [ #  # ]:          0 :         while (locked_pages > 0) {
    4870                 :            :                 page = extent_buffer_page(eb, i);
    4871                 :          0 :                 i++;
    4872                 :          0 :                 unlock_page(page);
    4873                 :          0 :                 locked_pages--;
    4874                 :            :         }
    4875                 :            :         return ret;
    4876                 :            : }
    4877                 :            : 
    4878                 :          0 : void read_extent_buffer(struct extent_buffer *eb, void *dstv,
    4879                 :            :                         unsigned long start,
    4880                 :            :                         unsigned long len)
    4881                 :            : {
    4882                 :            :         size_t cur;
    4883                 :            :         size_t offset;
    4884                 :            :         struct page *page;
    4885                 :            :         char *kaddr;
    4886                 :            :         char *dst = (char *)dstv;
    4887                 :          0 :         size_t start_offset = eb->start & ((u64)PAGE_CACHE_SIZE - 1);
    4888                 :          0 :         unsigned long i = (start_offset + start) >> PAGE_CACHE_SHIFT;
    4889                 :            : 
    4890         [ #  # ]:          0 :         WARN_ON(start > eb->len);
    4891         [ #  # ]:          0 :         WARN_ON(start + len > eb->start + eb->len);
    4892                 :            : 
    4893                 :          0 :         offset = (start_offset + start) & (PAGE_CACHE_SIZE - 1);
    4894                 :            : 
    4895         [ #  # ]:          0 :         while (len > 0) {
    4896                 :            :                 page = extent_buffer_page(eb, i);
    4897                 :            : 
    4898                 :          0 :                 cur = min(len, (PAGE_CACHE_SIZE - offset));
    4899                 :          0 :                 kaddr = page_address(page);
    4900                 :          0 :                 memcpy(dst, kaddr + offset, cur);
    4901                 :            : 
    4902                 :          0 :                 dst += cur;
    4903                 :          0 :                 len -= cur;
    4904                 :            :                 offset = 0;
    4905                 :          0 :                 i++;
    4906                 :            :         }
    4907                 :          0 : }
    4908                 :            : 
    4909                 :          0 : int map_private_extent_buffer(struct extent_buffer *eb, unsigned long start,
    4910                 :            :                                unsigned long min_len, char **map,
    4911                 :            :                                unsigned long *map_start,
    4912                 :            :                                unsigned long *map_len)
    4913                 :            : {
    4914                 :            :         size_t offset = start & (PAGE_CACHE_SIZE - 1);
    4915                 :            :         char *kaddr;
    4916                 :            :         struct page *p;
    4917                 :          0 :         size_t start_offset = eb->start & ((u64)PAGE_CACHE_SIZE - 1);
    4918                 :          0 :         unsigned long i = (start_offset + start) >> PAGE_CACHE_SHIFT;
    4919                 :          0 :         unsigned long end_i = (start_offset + start + min_len - 1) >>
    4920                 :            :                 PAGE_CACHE_SHIFT;
    4921                 :            : 
    4922         [ #  # ]:          0 :         if (i != end_i)
    4923                 :            :                 return -EINVAL;
    4924                 :            : 
    4925         [ #  # ]:          0 :         if (i == 0) {
    4926                 :            :                 offset = start_offset;
    4927                 :          0 :                 *map_start = 0;
    4928                 :            :         } else {
    4929                 :            :                 offset = 0;
    4930                 :          0 :                 *map_start = ((u64)i << PAGE_CACHE_SHIFT) - start_offset;
    4931                 :            :         }
    4932                 :            : 
    4933         [ #  # ]:          0 :         if (start + min_len > eb->len) {
    4934                 :          0 :                 WARN(1, KERN_ERR "btrfs bad mapping eb start %llu len %lu, "
    4935                 :            :                        "wanted %lu %lu\n",
    4936                 :            :                        eb->start, eb->len, start, min_len);
    4937                 :          0 :                 return -EINVAL;
    4938                 :            :         }
    4939                 :            : 
    4940                 :            :         p = extent_buffer_page(eb, i);
    4941                 :          0 :         kaddr = page_address(p);
    4942                 :          0 :         *map = kaddr + offset;
    4943                 :          0 :         *map_len = PAGE_CACHE_SIZE - offset;
    4944                 :          0 :         return 0;
    4945                 :            : }
    4946                 :            : 
    4947                 :          0 : int memcmp_extent_buffer(struct extent_buffer *eb, const void *ptrv,
    4948                 :            :                           unsigned long start,
    4949                 :            :                           unsigned long len)
    4950                 :            : {
    4951                 :            :         size_t cur;
    4952                 :            :         size_t offset;
    4953                 :            :         struct page *page;
    4954                 :            :         char *kaddr;
    4955                 :            :         char *ptr = (char *)ptrv;
    4956                 :          0 :         size_t start_offset = eb->start & ((u64)PAGE_CACHE_SIZE - 1);
    4957                 :          0 :         unsigned long i = (start_offset + start) >> PAGE_CACHE_SHIFT;
    4958                 :            :         int ret = 0;
    4959                 :            : 
    4960         [ #  # ]:          0 :         WARN_ON(start > eb->len);
    4961         [ #  # ]:          0 :         WARN_ON(start + len > eb->start + eb->len);
    4962                 :            : 
    4963                 :          0 :         offset = (start_offset + start) & (PAGE_CACHE_SIZE - 1);
    4964                 :            : 
    4965         [ #  # ]:          0 :         while (len > 0) {
    4966                 :            :                 page = extent_buffer_page(eb, i);
    4967                 :            : 
    4968                 :          0 :                 cur = min(len, (PAGE_CACHE_SIZE - offset));
    4969                 :            : 
    4970                 :          0 :                 kaddr = page_address(page);
    4971                 :          0 :                 ret = memcmp(ptr, kaddr + offset, cur);
    4972         [ #  # ]:          0 :                 if (ret)
    4973                 :            :                         break;
    4974                 :            : 
    4975                 :          0 :                 ptr += cur;
    4976                 :          0 :                 len -= cur;
    4977                 :            :                 offset = 0;
    4978                 :          0 :                 i++;
    4979                 :            :         }
    4980                 :          0 :         return ret;
    4981                 :            : }
    4982                 :            : 
    4983                 :          0 : void write_extent_buffer(struct extent_buffer *eb, const void *srcv,
    4984                 :            :                          unsigned long start, unsigned long len)
    4985                 :            : {
    4986                 :            :         size_t cur;
    4987                 :            :         size_t offset;
    4988                 :            :         struct page *page;
    4989                 :            :         char *kaddr;
    4990                 :            :         char *src = (char *)srcv;
    4991                 :          0 :         size_t start_offset = eb->start & ((u64)PAGE_CACHE_SIZE - 1);
    4992                 :          0 :         unsigned long i = (start_offset + start) >> PAGE_CACHE_SHIFT;
    4993                 :            : 
    4994         [ #  # ]:          0 :         WARN_ON(start > eb->len);
    4995         [ #  # ]:          0 :         WARN_ON(start + len > eb->start + eb->len);
    4996                 :            : 
    4997                 :          0 :         offset = (start_offset + start) & (PAGE_CACHE_SIZE - 1);
    4998                 :            : 
    4999         [ #  # ]:          0 :         while (len > 0) {
    5000                 :            :                 page = extent_buffer_page(eb, i);
    5001         [ #  # ]:          0 :                 WARN_ON(!PageUptodate(page));
    5002                 :            : 
    5003                 :          0 :                 cur = min(len, PAGE_CACHE_SIZE - offset);
    5004                 :          0 :                 kaddr = page_address(page);
    5005                 :          0 :                 memcpy(kaddr + offset, src, cur);
    5006                 :            : 
    5007                 :          0 :                 src += cur;
    5008                 :          0 :                 len -= cur;
    5009                 :            :                 offset = 0;
    5010                 :          0 :                 i++;
    5011                 :            :         }
    5012                 :          0 : }
    5013                 :            : 
    5014                 :          0 : void memset_extent_buffer(struct extent_buffer *eb, char c,
    5015                 :            :                           unsigned long start, unsigned long len)
    5016                 :            : {
    5017                 :            :         size_t cur;
    5018                 :            :         size_t offset;
    5019                 :            :         struct page *page;
    5020                 :            :         char *kaddr;
    5021                 :          0 :         size_t start_offset = eb->start & ((u64)PAGE_CACHE_SIZE - 1);
    5022                 :          0 :         unsigned long i = (start_offset + start) >> PAGE_CACHE_SHIFT;
    5023                 :            : 
    5024         [ #  # ]:          0 :         WARN_ON(start > eb->len);
    5025         [ #  # ]:          0 :         WARN_ON(start + len > eb->start + eb->len);
    5026                 :            : 
    5027                 :          0 :         offset = (start_offset + start) & (PAGE_CACHE_SIZE - 1);
    5028                 :            : 
    5029         [ #  # ]:          0 :         while (len > 0) {
    5030                 :            :                 page = extent_buffer_page(eb, i);
    5031         [ #  # ]:          0 :                 WARN_ON(!PageUptodate(page));
    5032                 :            : 
    5033                 :          0 :                 cur = min(len, PAGE_CACHE_SIZE - offset);
    5034                 :          0 :                 kaddr = page_address(page);
    5035 [ #  # ][ #  # ]:          0 :                 memset(kaddr + offset, c, cur);
                 [ #  # ]
    5036                 :            : 
    5037                 :          0 :                 len -= cur;
    5038                 :            :                 offset = 0;
    5039                 :          0 :                 i++;
    5040                 :            :         }
    5041                 :          0 : }
    5042                 :            : 
    5043                 :          0 : void copy_extent_buffer(struct extent_buffer *dst, struct extent_buffer *src,
    5044                 :            :                         unsigned long dst_offset, unsigned long src_offset,
    5045                 :            :                         unsigned long len)
    5046                 :            : {
    5047                 :          0 :         u64 dst_len = dst->len;
    5048                 :            :         size_t cur;
    5049                 :            :         size_t offset;
    5050                 :            :         struct page *page;
    5051                 :            :         char *kaddr;
    5052                 :          0 :         size_t start_offset = dst->start & ((u64)PAGE_CACHE_SIZE - 1);
    5053                 :          0 :         unsigned long i = (start_offset + dst_offset) >> PAGE_CACHE_SHIFT;
    5054                 :            : 
    5055         [ #  # ]:          0 :         WARN_ON(src->len != dst_len);
    5056                 :            : 
    5057                 :          0 :         offset = (start_offset + dst_offset) &
    5058                 :            :                 (PAGE_CACHE_SIZE - 1);
    5059                 :            : 
    5060         [ #  # ]:          0 :         while (len > 0) {
    5061                 :            :                 page = extent_buffer_page(dst, i);
    5062         [ #  # ]:          0 :                 WARN_ON(!PageUptodate(page));
    5063                 :            : 
    5064                 :          0 :                 cur = min(len, (unsigned long)(PAGE_CACHE_SIZE - offset));
    5065                 :            : 
    5066                 :          0 :                 kaddr = page_address(page);
    5067                 :          0 :                 read_extent_buffer(src, kaddr + offset, src_offset, cur);
    5068                 :            : 
    5069                 :          0 :                 src_offset += cur;
    5070                 :          0 :                 len -= cur;
    5071                 :            :                 offset = 0;
    5072                 :          0 :                 i++;
    5073                 :            :         }
    5074                 :          0 : }
    5075                 :            : 
    5076                 :            : static inline bool areas_overlap(unsigned long src, unsigned long dst, unsigned long len)
    5077                 :            : {
    5078         [ #  # ]:          0 :         unsigned long distance = (src > dst) ? src - dst : dst - src;
    5079                 :            :         return distance < len;
    5080                 :            : }
    5081                 :            : 
    5082                 :          0 : static void copy_pages(struct page *dst_page, struct page *src_page,
    5083                 :            :                        unsigned long dst_off, unsigned long src_off,
    5084                 :            :                        unsigned long len)
    5085                 :            : {
    5086                 :          0 :         char *dst_kaddr = page_address(dst_page);
    5087                 :            :         char *src_kaddr;
    5088                 :            :         int must_memmove = 0;
    5089                 :            : 
    5090         [ #  # ]:          0 :         if (dst_page != src_page) {
    5091                 :          0 :                 src_kaddr = page_address(src_page);
    5092                 :            :         } else {
    5093                 :            :                 src_kaddr = dst_kaddr;
    5094         [ #  # ]:          0 :                 if (areas_overlap(src_off, dst_off, len))
    5095                 :            :                         must_memmove = 1;
    5096                 :            :         }
    5097                 :            : 
    5098         [ #  # ]:          0 :         if (must_memmove)
    5099                 :          0 :                 memmove(dst_kaddr + dst_off, src_kaddr + src_off, len);
    5100                 :            :         else
    5101                 :          0 :                 memcpy(dst_kaddr + dst_off, src_kaddr + src_off, len);
    5102                 :          0 : }
    5103                 :            : 
    5104                 :          0 : void memcpy_extent_buffer(struct extent_buffer *dst, unsigned long dst_offset,
    5105                 :            :                            unsigned long src_offset, unsigned long len)
    5106                 :            : {
    5107                 :            :         size_t cur;
    5108                 :            :         size_t dst_off_in_page;
    5109                 :            :         size_t src_off_in_page;
    5110                 :          0 :         size_t start_offset = dst->start & ((u64)PAGE_CACHE_SIZE - 1);
    5111                 :            :         unsigned long dst_i;
    5112                 :            :         unsigned long src_i;
    5113                 :            : 
    5114         [ #  # ]:          0 :         if (src_offset + len > dst->len) {
    5115                 :          0 :                 printk(KERN_ERR "btrfs memmove bogus src_offset %lu move "
    5116                 :            :                        "len %lu dst len %lu\n", src_offset, len, dst->len);
    5117                 :          0 :                 BUG_ON(1);
    5118                 :            :         }
    5119         [ #  # ]:          0 :         if (dst_offset + len > dst->len) {
    5120                 :          0 :                 printk(KERN_ERR "btrfs memmove bogus dst_offset %lu move "
    5121                 :            :                        "len %lu dst len %lu\n", dst_offset, len, dst->len);
    5122                 :          0 :                 BUG_ON(1);
    5123                 :            :         }
    5124                 :            : 
    5125         [ #  # ]:          0 :         while (len > 0) {
    5126                 :          0 :                 dst_off_in_page = (start_offset + dst_offset) &
    5127                 :            :                         (PAGE_CACHE_SIZE - 1);
    5128                 :          0 :                 src_off_in_page = (start_offset + src_offset) &
    5129                 :            :                         (PAGE_CACHE_SIZE - 1);
    5130                 :            : 
    5131                 :          0 :                 dst_i = (start_offset + dst_offset) >> PAGE_CACHE_SHIFT;
    5132                 :          0 :                 src_i = (start_offset + src_offset) >> PAGE_CACHE_SHIFT;
    5133                 :            : 
    5134                 :          0 :                 cur = min(len, (unsigned long)(PAGE_CACHE_SIZE -
    5135                 :            :                                                src_off_in_page));
    5136                 :          0 :                 cur = min_t(unsigned long, cur,
    5137                 :            :                         (unsigned long)(PAGE_CACHE_SIZE - dst_off_in_page));
    5138                 :            : 
    5139                 :          0 :                 copy_pages(extent_buffer_page(dst, dst_i),
    5140                 :            :                            extent_buffer_page(dst, src_i),
    5141                 :            :                            dst_off_in_page, src_off_in_page, cur);
    5142                 :            : 
    5143                 :          0 :                 src_offset += cur;
    5144                 :          0 :                 dst_offset += cur;
    5145                 :          0 :                 len -= cur;
    5146                 :            :         }
    5147                 :          0 : }
    5148                 :            : 
    5149                 :          0 : void memmove_extent_buffer(struct extent_buffer *dst, unsigned long dst_offset,
    5150                 :            :                            unsigned long src_offset, unsigned long len)
    5151                 :            : {
    5152                 :            :         size_t cur;
    5153                 :            :         size_t dst_off_in_page;
    5154                 :            :         size_t src_off_in_page;
    5155                 :          0 :         unsigned long dst_end = dst_offset + len - 1;
    5156                 :          0 :         unsigned long src_end = src_offset + len - 1;
    5157                 :          0 :         size_t start_offset = dst->start & ((u64)PAGE_CACHE_SIZE - 1);
    5158                 :            :         unsigned long dst_i;
    5159                 :            :         unsigned long src_i;
    5160                 :            : 
    5161         [ #  # ]:          0 :         if (src_offset + len > dst->len) {
    5162                 :          0 :                 printk(KERN_ERR "btrfs memmove bogus src_offset %lu move "
    5163                 :            :                        "len %lu len %lu\n", src_offset, len, dst->len);
    5164                 :          0 :                 BUG_ON(1);
    5165                 :            :         }
    5166         [ #  # ]:          0 :         if (dst_offset + len > dst->len) {
    5167                 :          0 :                 printk(KERN_ERR "btrfs memmove bogus dst_offset %lu move "
    5168                 :            :                        "len %lu len %lu\n", dst_offset, len, dst->len);
    5169                 :          0 :                 BUG_ON(1);
    5170                 :            :         }
    5171         [ #  # ]:          0 :         if (dst_offset < src_offset) {
    5172                 :          0 :                 memcpy_extent_buffer(dst, dst_offset, src_offset, len);
    5173                 :          0 :                 return;
    5174                 :            :         }
    5175         [ #  # ]:          0 :         while (len > 0) {
    5176                 :          0 :                 dst_i = (start_offset + dst_end) >> PAGE_CACHE_SHIFT;
    5177                 :          0 :                 src_i = (start_offset + src_end) >> PAGE_CACHE_SHIFT;
    5178                 :            : 
    5179                 :          0 :                 dst_off_in_page = (start_offset + dst_end) &
    5180                 :            :                         (PAGE_CACHE_SIZE - 1);
    5181                 :          0 :                 src_off_in_page = (start_offset + src_end) &
    5182                 :            :                         (PAGE_CACHE_SIZE - 1);
    5183                 :            : 
    5184                 :          0 :                 cur = min_t(unsigned long, len, src_off_in_page + 1);
    5185                 :          0 :                 cur = min(cur, dst_off_in_page + 1);
    5186                 :          0 :                 copy_pages(extent_buffer_page(dst, dst_i),
    5187                 :            :                            extent_buffer_page(dst, src_i),
    5188                 :          0 :                            dst_off_in_page - cur + 1,
    5189                 :          0 :                            src_off_in_page - cur + 1, cur);
    5190                 :            : 
    5191                 :          0 :                 dst_end -= cur;
    5192                 :          0 :                 src_end -= cur;
    5193                 :          0 :                 len -= cur;
    5194                 :            :         }
    5195                 :            : }
    5196                 :            : 
    5197                 :          0 : int try_release_extent_buffer(struct page *page)
    5198                 :            : {
    5199                 :            :         struct extent_buffer *eb;
    5200                 :            : 
    5201                 :            :         /*
    5202                 :            :          * We need to make sure noboody is attaching this page to an eb right
    5203                 :            :          * now.
    5204                 :            :          */
    5205                 :          0 :         spin_lock(&page->mapping->private_lock);
    5206         [ #  # ]:          0 :         if (!PagePrivate(page)) {
    5207                 :          0 :                 spin_unlock(&page->mapping->private_lock);
    5208                 :          0 :                 return 1;
    5209                 :            :         }
    5210                 :            : 
    5211                 :          0 :         eb = (struct extent_buffer *)page->private;
    5212         [ #  # ]:          0 :         BUG_ON(!eb);
    5213                 :            : 
    5214                 :            :         /*
    5215                 :            :          * This is a little awful but should be ok, we need to make sure that
    5216                 :            :          * the eb doesn't disappear out from under us while we're looking at
    5217                 :            :          * this page.
    5218                 :            :          */
    5219                 :            :         spin_lock(&eb->refs_lock);
    5220 [ #  # ][ #  # ]:          0 :         if (atomic_read(&eb->refs) != 1 || extent_buffer_under_io(eb)) {
    5221                 :            :                 spin_unlock(&eb->refs_lock);
    5222                 :          0 :                 spin_unlock(&page->mapping->private_lock);
    5223                 :          0 :                 return 0;
    5224                 :            :         }
    5225                 :          0 :         spin_unlock(&page->mapping->private_lock);
    5226                 :            : 
    5227                 :            :         /*
    5228                 :            :          * If tree ref isn't set then we know the ref on this eb is a real ref,
    5229                 :            :          * so just return, this page will likely be freed soon anyway.
    5230                 :            :          */
    5231         [ #  # ]:          0 :         if (!test_and_clear_bit(EXTENT_BUFFER_TREE_REF, &eb->bflags)) {
    5232                 :            :                 spin_unlock(&eb->refs_lock);
    5233                 :          0 :                 return 0;
    5234                 :            :         }
    5235                 :            : 
    5236                 :          0 :         return release_extent_buffer(eb);
    5237                 :            : }

Generated by: LCOV version 1.9